30.11.2023

Мысленный эксперимент в Национальной библиотеке Таиланда

1 min read

С появлением ChatGPT большие языковые модели (LLM) превратились из относительно нишевой темы в то, с чем столкнулись многие и многие люди. ChatGPT представлен как развлекательная система для общения, диалоговый партнер и (через Bing) поисковый интерфейс. в его тренировочных данных. Поскольку он очень точно моделирует эти распределения, он хорошо выдает правдоподобно звучащий текст в разных стилях. Но, как всегда, если этот текст имеет смысл, то это потому, что мы, читатели, понимаем его.

В книге «Восхождение к NLU: о значении, форме и понимании в эпоху данных» (2020) мы с Александром Коллером излагаем аргумент о том, что такие системы не могут изучать значение (ни «понимать» вводимые ими данные, ни выражать коммуникативное намерение), потому что их режим обучения состоит только из формы языка. Различие между формой и значением в лингвистических системах тонкое, не в последнюю очередь потому, что как только мы (люди!) выучили язык, как только мы видим или слышим какую-либо форму в этом языке, мы сразу же получаем доступ и к значению.

Но мы можем сделать это только потому, что изучили языковую систему, к которой принадлежит форма. В случае с нашими первыми языками это обучение происходило в социально обусловленных, воплощенных взаимодействиях, которые позволили нам начать знакомство с языковой системой, и расширилось за счет более социально обусловленных, воплощенных взаимодействий, в том числе некоторых, в которых мы использовали то, что уже знали о языке. язык, чтобы узнать больше. Что касается второго языка, мы могли бы начать с обучения, которое явно использовало наши навыки первого языка.

Тем не менее, когда мы видим языковую модель, производящую, казалось бы, связный вывод, и думаем о ее обучающих данных, если эти данные поступают из языка, на котором мы говорим, трудно удерживать в фокусе тот факт, что компьютер только манипулирует формой — и формой. не «несет» значения, за исключением тех, кто знает лингвистическую систему.

Чтобы попытаться привлечь внимание к разнице между формой и значением, мне нравится проводить людей через мысленный эксперимент. Подумайте о языке, на котором вы не говорите, который к тому же написан неидеографической системой письма, которую вы не читаете. Для многих (но далеко не для всех) людей, читающих этот пост, тайский язык может подойти под это описание, поэтому в этом примере я буду использовать тайский язык.

Представьте, что вы находитесь в Национальной библиотеке Таиланда (страница тайской Википедии). У вас есть доступ ко всем книгам в этой библиотеке, кроме тех, которые имеют иллюстрации или написаны не на тайском языке. У вас есть неограниченное время, и ваши физические потребности удовлетворяются, но нет людей, с которыми можно было бы взаимодействовать. Могли бы вы научиться понимать письменный тайский язык? Если да, то как бы вы этого добились? (Пожалуйста, подумайте немного, прежде чем читать дальше.)

Национальная библиотека Таиланда, богато украшенное белое здание с деревьями, в том числе с розовыми цветами на переднем плане. Фото предоставлено: Пэт Роенгпитья.
У меня был этот разговор со многими людьми. Некоторые идеи, которые возникли:

Найдите иллюстрированную энциклопедию. [Извините, я удалил все книги с фотографиями, помните?]
Найдите научные статьи, в которых английские заимствования могут быть записаны в английской орфографии. [Они тоже ушли. Я был тщательным.]
Терпеливо сопоставьте список всех строк, найдите наиболее часто встречающиеся из них и сделайте вывод, что это служебные слова, такие как эквиваленты и, the, или to, или любых других элементов, которые грамматикализуются в тайском языке. [На самом деле тайский язык не использует разделители пробелов для слов, так что эта стратегия будет очень сложной. Если бы вы преуспели, вы бы преуспели, потому что привнесли в ситуацию дополнительные знания, которых нет у LLM. Кроме того, служебные слова не сильно помогут вам с точки зрения фактического содержания.]
Неограниченное время и вкусная тайская еда? Я бы просто сидел и наслаждался этим. [Большой! Но также это не приведет к изучению тайского языка.]
Ищите, пока не найдете что-то, что по формату явно является переводом книги, которую вы уже хорошо знаете, на другом языке. [Опять привнесение внешней информации.]
Посмотрите, как книги организованы в библиотеке, и найдите слова (подстроки), которые кажутся непропорциональными в каждом разделе (по сравнению с другими). Сделайте вывод, что это слова, имеющие отношение к теме этого раздела. [Конечно, это был бы интересный способ разделить словарный запас, но как бы вы на самом деле выяснили, что означает любое из слов?]
Без какой-либо возможности связать рассматриваемые тексты с чем-либо вне языка, т. е. с гипотезами об их коммуникативном намерении, вы не сможете оторваться от этой задачи. Большинство описанных выше стратегий включают получение дополнительной информации, которая позволит вам выдвинуть эти гипотезы — что-то, выходящее за рамки строгой формы языка.

Вы могли бы, если бы вам не надоело, действительно хорошо знать, как «выглядит» разумная строка тайского языка. Вы могли бы

Copyright © All rights reserved. | Newsphere by AF themes.