Предсказания, большие данные и новые измерители: о возможности технологий компьютерной лингвистики в теоретических лингвистических исследованиях

А. А. Бонч-Осмоловская

?

Предсказания, большие данные и новые измерители: о возможности технологий компьютерной лингвистики в теоретических лингвистических исследованиях

Вопросы языкознания. 2016. № 2. С. 100–120.

Бонч-Осмоловская А. А.

Статья посвящена обзору работ последних лет, в которых теоретическая исследовательская задача решается с помощью методов или инструментов, используемых в компьютерной лингвистике. В обзоре проводится подробный анализ того, как именно с помощью применения того или иного инструмента или метода можно получить новые знания о природе языка. В частности, выделяются два основных направления, развитие которых в рамках теоретических исследований представляется чрезвычайно перспективным. Это, с одной стороны, применение алгоритмов машинного обучения как предсказательной модели для описания многофакторных языковых явлений, с другой стороны использование возможностей, открывающихся для типологических исследований и межъязыковых сравнения благодаря созданию множества «глубоко аннотированных» корпусов для разных языков, т.е. корпусов со сложной разметкой, например, синтаксической или референциальной. Уже сейчас объем имеющихся различных данных позволяет делать определенные выводы о свойствах тех или иных универсалий, которые были описаны раньше в теоретических типологических работах.

Научное направление: Компьютерные науки Филология и лингвистика

Приоритетные направления: гуманитарные науки

Язык: русский

Полный текст

Ключевые слова: машинное обучение компьютерная лингвистика типология теория языка синтаксис syntax machine learning computational linguistics language typology language theory

ПУБЛИКАЦИЯ ПОДГОТОВЛЕНА ПО РЕЗУЛЬТАТАМ ПРОЕКТА:

Применение методов автоматического анализа естественного языка для теоретического исследования семантико-грамматических конструкций в русском языке (2014)

Современные проблемы и тенденции компьютерной лингвистики

Толдова С. Ю., Ляшевская О. Н., Вопросы языкознания 2014 № 1 С. 120–145

Статья посвящена обзору современных тематик и актуальных направлений компьютерной лингвистики на основе анализа материалов одной из конференции в этой области, а именно, 24-ой Международная конференция по компьютерной лингвистике Coling2012. В ней приводится анализ основных подходов и проблемных точек в таких традиционных областях автоматической обработки текста, как автоматический морфологический и синтаксический анализ, машинный перевод и др. ...

Добавлено: 15 октября 2013 г.

Texterra: инфраструктура для анализа текстов

Денис Турдаков, Астраханцев Н. А., Недумов Я. Р. и др., Труды Института системного программирования РАН 2014 Т. 26 С. 421–438

В статье описан проект Texterra, в рамках которого была создана инфраструктура для анализа текстов. Texterra предоставляет масштабируемое решение для быстрой обработки текстовых документов, основанное на использовании знаний, извлекаемых из Веб-ресурсов и текстовых документов. В данной статье раскрываются детали реализации проекта, варианты использования и результаты экспериментальных исследований разработанных инструментов. ...

Добавлено: 6 ноября 2017 г.

Прикладная и компьютерная лингвистика

М.: Ленанд, 2017.

Вниманию читателей предлагается первое на русском языке практическое введение в современные лингвистические технологии. Из книги можно узнать о применении знаний о языке для решения прикладных задач. Монография позволяет найти ответы на базовые вопросы, возникающие у начинающего исследователя: как работают современные лингвистические технологии, где взять основные компоненты программ и что читать дальше для углубленного понимания. Многие сложные научно-технические проблемы станут намного ...

Добавлено: 31 декабря 2017 г.

Национальный корпус русского языка как основа новаторских электронных учебников

Сибирцева В. Г., Хоменко А. Ю., Баранова Ю. Н., Образовательные технологии и общество 2013 Т. 16 № 3 С. 508–521

В статье идёт речь о разработках научно-учебной группы студентов и преподавателей Национального исследовательского университета – Высшей школы экономики «Корплинги (Нижний Новгород-Москва)». Данная работа связана с исследованиями в области компьютерной и корпусной лингвистики. Разработки нацелены в первую очередь на создание интерактивных ресурсов, основанных на материалах Национального корпуса русского языка, для обучения студентов русскому языку как иностранному. ...

Добавлено: 4 октября 2013 г.

Проблемы обработки естественного языка в диалоговых системах

Клышинский Э. С., Жеребцова Ю., Чижик А., Системный администратор 2019 № 10 С. 82–91

Диалоговые системы (ДС) – на сегодняшний день одна из самых стремительно развивающихся и перспективных областей искусственного интеллекта. Исследования в этой области вызывают интерес как научного сообщества, так и индустрии, где все чаще говорят о внедрении интеллектуальных агентов с разговорным интерфейсом. Одним из наиболее обсуждаемых направлений развития ДС последнего времени является реализация возможности интеллектуального агента поддерживать ...

Добавлено: 26 октября 2019 г.

Computational Linguistics and Intellectual Technologies Papers from the Annual International Conference “Dialogue” (2019)

M.: Russian State University for the Humanitie, 2019.

Сборник включает 64 доклада международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог 2019», представляющих широкий спектр теоретических и прикладных исследований в области описания естественного языка, моделирования языковых процессов, создания практически применимых компьютерных лингвистических технологий. ...

Добавлено: 16 октября 2019 г.

NELS 44: Proceedings of the Forty-Fourth Annual Meeting of the North East Linguistics Society

Amherst: GLSA Publ., 2014.

NELS has always been and remains the most prestigious conference in theoretical linguistics hosted in its geographical area and is among the most highly respected in the field at large. (Conferences in theoretical linguistics of comparable quality, hosted in different geographical areas, include the Chicago Linguistic Society, the West Coast Conference on Formal Linguistics (WCCFL), ...

Добавлено: 18 октября 2014 г.

Иерархия и взаимодействие грамматических категорий глагола

Выдрин А. П., Генюшене Э., Герасимов Д. В. и др., СПб.: Институт лингвистических исследований РАН, 2020.

Предлагаемая вниманию читателей книга продолжает серию коллективных монографий, подготовленных в Лаборатории типологического изучения языков Института лингвистических исследований Российской академии наук. В отличие от предыдущих, посвящённых отдельным глагольными категориям и отдельным синтаксическим конструкциям, настоящая коллективная монография обращена к тематике иерархии и взаимодействия глагольных категорий. Монографию открывает обобщающая статья редакторов сборника (В. С. Храковского, А. Л. Мальчукова), ...

Добавлено: 6 октября 2020 г.

Proceedings of the 14th Conference of the European Chapter of the Association for Computational Linguistics

Association for Computational Linguistics, 2014.

Proceedings of the 14th Conference of the European Chapter of the Association for Computational Linguistics held 26–30 April 2014 in Gothenburg, Sweden. ...

Добавлено: 24 октября 2013 г.

Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 4 — 8 июня 2014 г.)

М.: Изд-во РГГУ, 2014.

Сборник включает 64 доклада международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог 2014», представляющих широкий спектр теоретических и прикладных исследований в области описания естественного языка, моделирования языковых процессов, создания практически применимых компьютерных лингвистических технологий. ...

Добавлено: 20 августа 2014 г.

Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 29 мая - 2 июня 2013 г.). В 2-х т.

М.: РГГУ, 2013.

Сборник включает 84 доклада международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог 2013», представляющих широкий спектр теоретических и прикладных исследований в области описания естественного языка, моделирования языковых процессов, создания практически применимых компьютерных лингвистических технологий. Для специалистов в области теоретической и прикладной лингвистики и интеллектуальных технологий. ...

Добавлено: 13 мая 2013 г.

Proceedings of the 8th Workshop on Altaic Formal Linguistics (WAFL8)

Cambridge: MIT Working Papers in Linguistics, 2013.

This volume contains the proceedings of WAFL8, the annual Workshop on Altaic Formal Linguistics. WAFL is one of the major conferences on the formal analysis of the languages of the Altaic macro-family. The contributions in the volume address different questions in syntax, semantics, and phonology of Japanese, Korean, Mongolian and various Turkic languages. ...

Добавлено: 18 октября 2014 г.

Труды международной конференции «КОРПУСНАЯ ЛИНГВИСТИКА – 2017»

СПб.: Издательство СПбГУ, 2017.

Труды международной конференции. ...

Добавлено: 31 декабря 2017 г.

Proceedings of the Seventh conference on International Language Resources and Evaluation (LREC'10), Valletta, Malta, 17-23 May 2010

Valletta: ELRA, 2010.

Добавлено: 17 декабря 2012 г.

Компьютерная лингвистика и интеллектуальные технологии 2013: Доклады, принятые к публикации на сайте

[б.и.], 2013.

На сайте dialog-21.ru опубликованы тексты статей, принятых к электронной публикации. Они включают широкий спектр теоретических и прикладных исследований в области описания естественного языка, моделирования языковых процессов, создания практически применимых компьютерных лингвистических технологий. Для специалистов в области теоретической и прикладной лингвистики и интеллектуальных технологий. ...

Добавлено: 23 сентября 2013 г.

Анализ социальных сетей: методы и приложения

Сергей Кузнецов, Денис Турдаков, Коршунов А. В. и др., Труды Института системного программирования РАН 2014 Т. 26 № 1 С. 439–456

В статье описаны основные компоненты разработанного в ИСП РАН стека технологий для анализа пользовательских данных из социальных сетей. Особое внимание уделяется задачам, методам и приложениям анализа сетевых (социальные связи между пользователями) и текстовых (сообщения и профили пользователей) данных: определение демографических атрибутов пользователей, поиск описаний событий в корпусах сообщений, идентификация пользователей различных сетей, поиск сообществ пользователей ...

Добавлено: 25 ноября 2017 г.

Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 29 мая — 1 июня 2019 г.)

М.: Издательский центр «Российский государственный гуманитарный университет», 2019.

Добавлено: 16 октября 2019 г.

Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 17 июня — 20 июня 2020 г.)

М.: Изд-во РГГУ, 2020.

Сборник включает 60 докладов международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог 2020», представляющих широкий спектр теоретических и прикладных исследований в области описания естественного языка, моделирования языковых процессов, создания практически применимых компьютерных лингвистических технологий. Для специалистов в области теоретической и прикладной лингвистики и интеллектуальных технологий. ...

Добавлено: 26 июня 2020 г.

Toxic Comments Detection in Russian

Сметанин С. И., , in: Компьютерная лингвистика и интеллектуальные технологии: по материалам ежегодной международной конференции «Диалог» (Москва, 17–20 июня 2020 г.)Issue 19(26): дополнительный том.: -, 2020. P. 1149–1159.

Добавлено: 30 ноября 2020 г.

Обобщения, ориентированные на исходную точку деривации vs. на продукт деривации, в описании синтаксических процессов

Летучий А. Б., Acta Linguistica Petropolitana. Труды института лингвистических исследований 2014 Т. 10 № 2 С. 292–330

В статье на материале русского языка показана релевантность для синтаксиса введённого в 1985 г. Джоан Байби для морфологии и фонологии противопоставления "product-based generalizations" и "source-based generalizations". ...

Добавлено: 6 октября 2014 г.

Historical development of labile verbs in modern Russian

Летучий А. Б., Linguistics 2015 Vol. 53 No. 3 P. 611–647

В статье рассматривается становление класса лабильных глаголов движения в современном русском языке. Как выясняется, многие из лабильных глаголов ("мчать", "двигать", "кружить", "катить") приобрели или укрепили свою лабильность в течение последних двух столетий, а до этого были строго переходными. Выравнивание частотности переходного и непереходного употреблений сопровождалось расширением класса ситуаций, с которыми сочетается непереходное употребление. ...

Добавлено: 8 февраля 2015 г.

The 26th International Conference on Computational Linguistics (COLING 2016)

[б.и.], 2016.

Добавлено: 1 декабря 2016 г.

Diagnostic Test Approaches to Machine Learning and Commonsense Reasoning Systems

Найденова К., Игнатов Д. И., Hershey: IGI Global, 2012.

The consideration of symbolic machine learning algorithms as an entire class will make it possible, in the future, to generate algorithms, with the aid of some parameters, depending on the initial users’ requirements and the quality of solving targeted problems in domain applications. Diagnostic Test Approaches to Machine Learning and Commonsense Reasoning Systems surveys, analyzes, and ...

Добавлено: 3 декабря 2012 г.

Рецензия на сборник: A. Holvoet, N. Nau (eds). Grammatical relations and their non-canonical encoding in Baltic. Amsterdam: John Benjamins, 2014.

Летучий А. Б., Вопросы языкознания 2015 № 6 С. 140–151

Рецензия посвящена сборнику под редакцией Акселя Хольфута и Николь Нау о кодировании грамматических отношений в балтийских языках. Сборник включает матерал литовского, латышского, ливонского языков, который рассматривается как в формальной, так и в функциональной парадигме. Среди затрагиваемых проблем - расщеплённое маркирование объекта и субъекта, семантическая мотивация моделей управления, влияние отрицания на модель управления глагола и другие. ...

Добавлено: 12 декабря 2016 г.