Red Sun
Модератор
- 01.01.22
- 44.122
- 500.675
Другие курсы от автора:
[Paul Mascetta] Оружие массового убеждения - как заставить мозг клиента...
[Kiely Mizumoto] Как зарабатывать 10000$ в месяц на видеосъемке без...
[Максим Смирнов] [stepik] Excel аналитика: ключевые функции для офисников (2025)
[Максим Смирнов] [stepik] Excel для продолжающих: финансы и инвестиции с...
[Мария Антонова] [klerk] Налоговая нагрузка и законные способы налоговой...
[stepik, IT Extra] Как работают компьютерные сети. Просто о сложном. Глава 2...
[Александра Гуреева] Пушка продаж 2026: Новогоднее издание (2025)
[Kiely Mizumoto] Как зарабатывать 10000$ в месяц на видеосъемке без...
[Максим Смирнов] [stepik] Excel аналитика: ключевые функции для офисников (2025)
[Максим Смирнов] [stepik] Excel для продолжающих: финансы и инвестиции с...
[Мария Антонова] [klerk] Налоговая нагрузка и законные способы налоговой...
[stepik, IT Extra] Как работают компьютерные сети. Просто о сложном. Глава 2...
[Александра Гуреева] Пушка продаж 2026: Новогоднее издание (2025)
Автор: Архэ
Название: Компьютерная лингвистика. Классификация, кластеризация и оценка сходства текстов (2024)
Описание
Компьютерная лингвистика — одна из наиболее динамично развивающихся областей на стыке теории и практики. С достижениями компьютерной лингвистики мы сталкиваемся каждый день: это и машинный перевод, и поиск в Интернете, и голосовые помощники, и многое другое. За каждым таким продуктом стоит серьёзная работа лингвистов и программистов. В ходе курса мы поговорим об истории компьютерной лингвистики и о наиболее популярных её методах, а также посмотрим, как они позволяют решать важные практические задачи: например, проверять орфографию или классифицировать по темам новости.
7. Классификация, кластеризация и оценка сходства текстов
Одна из важных задач компьютерной лингвистики — объединение похожих текстов в группы. Это может быть как деление на заранее заданные классы («Спорт», «Политика» и т. п.), так и деление на основе сходства самих текстов. К примеру, новостные агрегаторы сперва объединяют похожие тексты в один сюжет, а затем относят его к определенному классу. На занятии мы поговорим о том, как можно оценивать расстояние между текстами, чем отличается задача классификации от задачи кластеризации и как такие задачи решаются.
Лектор: Пиперски Александр Чедович, кандидат филологических наук, доцент Института лингвистики РГГУ, научный сотрудник Школы филологии НИУ ВШЭ.
Подробнее:
Название: Компьютерная лингвистика. Классификация, кластеризация и оценка сходства текстов (2024)
Описание
Компьютерная лингвистика — одна из наиболее динамично развивающихся областей на стыке теории и практики. С достижениями компьютерной лингвистики мы сталкиваемся каждый день: это и машинный перевод, и поиск в Интернете, и голосовые помощники, и многое другое. За каждым таким продуктом стоит серьёзная работа лингвистов и программистов. В ходе курса мы поговорим об истории компьютерной лингвистики и о наиболее популярных её методах, а также посмотрим, как они позволяют решать важные практические задачи: например, проверять орфографию или классифицировать по темам новости.
7. Классификация, кластеризация и оценка сходства текстов
Одна из важных задач компьютерной лингвистики — объединение похожих текстов в группы. Это может быть как деление на заранее заданные классы («Спорт», «Политика» и т. п.), так и деление на основе сходства самих текстов. К примеру, новостные агрегаторы сперва объединяют похожие тексты в один сюжет, а затем относят его к определенному классу. На занятии мы поговорим о том, как можно оценивать расстояние между текстами, чем отличается задача классификации от задачи кластеризации и как такие задачи решаются.
Лектор: Пиперски Александр Чедович, кандидат филологических наук, доцент Института лингвистики РГГУ, научный сотрудник Школы филологии НИУ ВШЭ.
Подробнее:
Скачать:
Для просмотра скрытого содержимого вы должны войти или зарегистрироваться.