US Ads

четверг

Компьютеры в человеческом мире неоднозначных слов

Когда речь заходит об обучении компьютерной системы, наибольшую проблему представляет неоднозначность в языке. Новое исследование, проведенное британскими учеными, имеет целью помочь компьютерам найти смысл человеческих слов. Подробности этого исследования были опубликованы в мае 2013 года на вебсайте исследовательского центра Кембриджского университета (Соединенное Королевство).

Суть проблемы в том, что в английском языке глагол run (бегать, работать) имеет 606 различных значений. В Оксфордском словаре английского языка запись этого глагола, помещенная во главе целого набора, содержит 546 значений.

Как признают сами англичане, слова с несколькими значениями обеспечивают им настоящее языковое богатство. В то же время, несколько значений одного слова могут создавать неопределенность. Например, английская фраза putting money in the bank может означать помещение денег в финансовое учреждение или закапывание денег на берегу реки. А рисунок пистолета может означать побуждение к действию в виде вытаскивания пистолета или иллюстрацию оружия.

Люди могут перемещаться по этой потенциальной путанице, потому что человеческий  мозг принимает во внимание контекст, когда общий смысл уточняет значение окружающих слов и предложений. Поэтому, если фраза putting money in the bank произносится или читается в контексте, который включает в себя такие слова, как сбережение и инвестиция, то мы можем угадать смысл фразы и положить деньги в банк. Но для компьютеров так называемая лексическая неоднозначность представляет собой серьезную проблему.

Доктор Стивен Кларк (Dr Stephen Clark) из компьютерной лаборатории Кембриджского университета считает, что неоднозначность является самым узким местом в вопросе приобретения вычислительных знаний и это своего рода сногсшибательная проблема для всех видов обработки естественного языка. По его мнению, компьютеры являются безнадежными в вопросе неоднозначности, т.е. в понимании того, какое из нескольких значений является правильным, потому что ЭВМ не имеют знаний о человеческом мире.

Недавно доктор Кларк возглавил два масштабных исследовательских проекта, один из них финансируется британским исследовательским советом в области инженерных и физических наук (Engineering and Physical Sciences Research Council, EPSRC), а второй  финансируется Европейским исследовательским советом (European Research Council, ERC). Перед обоими этими проектами поставлена цель преодолеть это узкое место. Приложения данных исследований включают в себя улучшения для Интернет -поиска, машинного перевода, автоматической маркировки и обобщения.

Как пояснил Кларк, многие из достигнутых успехов в области языковой обработки, такие как онлайн-инструмент для перевода текста, основаны на статистических моделях, которые "изучают" связи и взаимоотношения между словами в разных языках. Но если возникает необходимость, чтобы компьютер в действительности мог понять текст, тогда требуется совершенно новый способ языковой обработки.

В 2009 году Эрик Шмидт (Eric Schmidt), являющийся председателем совета директоров компании Google, как-то сказал, что было бы неплохо, если бы поисковая система Google понимала смысл вашей фразы, а не только слова, которые находятся в этой фразе. 

Стремясь найти решение настоящей проблемы, доктор Кларк обратился к квантовой механике и к пионеру категорической квантовой механики Бобу Коицки (Bob Coecke), с которым он поддерживает многолетнее сотрудничество. Боб Коицки является профессором подразделения по квантовым основам, структурам и логики при Оксфордском университете. Так же Кларк уствновил сотрудничество с доктором Мехрнуш Садрзаде (Dr Mehrnoosh Sadrzadeh) из лондонского университете Квин Мэри, который работает над логическими приложениями в информатике и лингвистике.

По словам Кларка, между квантовой физикой, квантовыми вычислениями и лингвистикой есть интересные связи. Математика на высоком уровне, которую Боб Коицки использует для описания квантовой механики и которая также применяется в некоторых областях информатики, оказалась удивительно похожа на математику, которую использовали Садрзаде и Кларк для описания грамматической структуры словесного предложения.

Квантовая механика стремится объяснить, что и как происходит, когда объединяются два квантовых объекта. В свою очередь, Садрзаде и Кларк хотели понять, что происходит со значением фразы или предложения, когда объединяются два слова или две фразы.

До настоящего времени компьютерные ученые применяли два основных подхода при моделировании значений языка: композиционный и распределительный. 

Первый композиционный подход основан на раннем философском принципе, когда смысл фразы можно определить из значений ее частей и как эти части объединяются между собой. Например, даже если вы никогда не слышали фразу "муравьед спит", вы все равно знаете, что это означает, потому что вы знаете смысл слова муравьед и смысл понятия спать, а самое главное, вы знаете, как поставить вместе значения этих двух слов.

По мнению Кларка, композиционный подход устраняет основную проблему в области лингвистики. Получается, что люди способны генерировать неограниченное количество предложений, используя ограниченный словарный запас. Поэтому британские ученые хотели бы, чтобы компьютеры тоже имели потенциал, похожий на человеческий.

Второй подход является более поздним и носит название распределительного подхода. Его суть заключается в фокусировании на значениях самих слов и в основе подхода лежит принцип, при котором значения слов могут быть разработаны с учетом контекста, в котором слова появляются в тексте. С учетом этого подхода британские ученые строят геометрическое пространство или облако, в котором сидят значения слов. Их позиция в облаке определяется сортом слова, который можно найти в их контексте. Поэтому, если вы проделали моделирование слов для собак и кошек, то вы увидите в облаке много одинаковых слов - домашнее животное, ветеринар, еда - потому, что собака и кошка часто встречаются в подобных контекстах.

Работая с исследователями из университетов Эдинбурга, Оксфорда, Сассекса и Йорка, Кларк планирует использовать сильные стороны этих двух подходов через единую математическую модель. По его мнению, композиционный подход концентрируется на том, как объединить смыслы, но мало что может сказать об отдельных значениях слов; а распределительный подход тесно связан с значениями слов, но мало что может сказать о том, как эти значения объединить.

Опираясь на математику квантовой механики, британские исследователи теперь имеют основу для объединения этих подходов в одно целое. Их цель заключается в том, чтобы в течение следующих пяти лет доработать этот процесс до стадии использования компьютером. Последние десять лет Кларк провел за разработкой сложного синтаксического анализатора (parser), представляющего собой программу, которая берет предложения английского языка и работает над грамматическими отношениями между словами. Следующим шагом является добавление смысловой грамматики.

По словам Кларка, ученым нужно иметь много семантических и мировых знаний, чтобы решить проблему неоднозначности и построить смысловое представление фраз и предложений, которое компьютер мог бы использовать. Идея британских ученых состоит в том, чтобы взять парсер и объединить его с облаков слов, чтобы обеспечить новое смысловое представление, которое до этого не было доступно для компьютера, и что в конечном итоге должно помочь решить проблему неоднозначности.

В научной среде утверждается, что языковая технология, основанная на поверхностных подходах, достигает своего предела производительности, и следующее поколение языковых технологий потребует более сложную смысловую модель. В долгосрочной перспективе, целью является ввод дополнительных условий в смысловое представление, чтобы компьютеры могли извлекать смысл из изображений или текстов. Кларк называет эту цель амбициозной, но все британские ученые надеются, что этот инновационный способ решения проблемы поможет, наконец, компьютерам понять неоднозначный человеческий мир. 

Ссылка

University of Cambridge. Our ambiguous world of words.
http://www.cam.ac.uk/research/features/our-ambiguous-world-of-words


Эта статья лицензирована в соответствии с Creative Commons Licence
http://creativecommons.org/licenses/by-nc-sa/3.0/