Учебное пособие

   Учебное пособие, разработанное для слушателей школы.

   Выходные данные пособия:

Автоматическая обработка текстов на естественном языке и компьютерная лингвистика : учеб. пособие / Большакова Е.И., Клышинский Э.С., Ландэ Д.В., Носков А.А., Пескова О.В., Ягунова Е.В. - М.: МИЭМ, 2011. - 272 с.

 

Лекции

Большакова

   Извлечение_информации из текстов: портрет направления

   Компьютерная_лингвистик:_методы, ресурсы,_приложения

Бочаров

   Форум, общие вопросы. задача

   Построение тезауруса предметной области при помощи Википедии

   Извлечение фактов при помощи шаблонов

   Проекты MathLingvo

Клышинский

   Уровни анализа текстов

   Давайте напишем морфологию

Ландэ

   Основы концепции "Complex networks" и ее применений

   Модели информационных потоков

   Элементы фрактального анализа информационных потоков

   Самоподобие в информационном пространстве

Носков

Пескова

   Классификация полнотекстовых документов (Методы классификации с учителем)

   Классификация полнотекстовых документов (Методы классификации без учителя)

Федоровский

   Информационный поиск

Ягунова

   Язык. Текст. Лингвисты и лингвистики

   "Зачем", "что" и "как" в исследовании коллокаций. Вопросы и возможные ответы.

   Что такое текст? Лингвистика текста. Свертка / разрушение структуры текста. Разные виды контекста

Практические материалы

Скрипты, написанные Бочаровым, для вытаскивания информации о спорте из дампа Википедии

   http://code.google.com/p/clschool/

 

Использованный инструментарий

Морфологический анализатор АОТ

   http://aot.ru/download.php

Морфологический анализатор MyStem

   http://company.yandex.ru/technology/mystem

Морфологический анализатор Кросслейтор

   Crosslator.rar