Статьи по тематике nlp

Публикации по теме 'nlp'

Математика алгоритма TextRank

TextRank, PageRank в деталях с реализацией Numpy. Цель — Математика, лежащая в основе TextRank, PageRank подробно объясняется с реализацией Numpy и используется для создания сводки. TextRank — графическая модель ранжирования для обработки текста, которую можно использовать для поиска наиболее релевантных предложений в текстовых документах. Приложение Извлекательное обобщение , а также для поиска ключевых слов/фраз . Рассматриваемая тема Объяснение PageRank Объяснение..

НЛП в Python - векторизация

Общие методы векторизации, используемые в типичном конвейере модели машинного обучения НЛП с использованием набора данных реальных фейковых новостей от Kaggle. В этой статье мы узнаем о векторизации и различных методах векторизации, используемых в модели НЛП. Затем мы применим эти концепции к контексту проблемы. Мы будем работать с набором данных, который классифицирует новости как поддельные или настоящие. Набор данных доступен на Kaggle, ссылка на набор данных находится ниже:..

Крушение искусственного интеллекта

При правильном обучении искусственный интеллект (ИИ) может выполнять задачи намного точнее и точнее , чем люди. Это не новость, поскольку это наблюдается во многих отраслях, например в автономных транспортных средствах. Вся цель разработки беспилотных автомобилей - это акцент на аспект безопасности технологии, все благодаря точным движениям, рассчитываемым ИИ. По сути, этот ИИ действует как человек, задавая вопросы, например, впереди левый поворот, приближаются ли какие-нибудь машины?..

Когда еда встречает искусственный интеллект: проект умных рецептов

Когда еда встречает искусственный интеллект: проект умных рецептов Оскар Уайльд сказал: «Я терпеть не могу людей, которые не относятся к еде серьезно», и мы полностью с ним согласны. Еда - одна из важнейших вещей, с которыми мы сталкиваемся каждый день, и не только потому, что это наш главный источник выживания. Кулинарные рецепты, видео и фотографии повсюду в сети, которая на сегодняшний день является крупнейшим архивом контента, связанного с едой. Но что, если этот большой объем..

Мягкое введение в Doc2Vec

TL;DR В этом посте вы узнаете, что такое doc2vec , как он построен, как он связан с word2vec , что вы можете с ним делать, надеюсь, без математических формул. Хотите узнать больше? посетите www.shibumi-ai.com вступление Числовое представление текстовых документов - сложная задача в машинном обучении. Такое представление может использоваться для многих целей, например: поиск документов, веб-поиск, фильтрация спама, моделирование тем и т. Д. Однако для этого не так много..

Но как именно работают трансформаторы?

Внимание — это все, что вам нужно! «У Индии очень хорошие отношения с Россией. Вместе с ними было закуплено множество новейших технологий. У Японии тоже хорошие отношения, но ни одна страна не заменила прежние». Вышеупомянутые строки могут вызвать путаницу в любой модели машинного обучения, когда речь идет о следующих словах: «ЭТО», «ИХ», «БЫВШИЙ». В абзаце указаны три страны, и модели путаются, о чем говорят эти слова. Но разве мы сбиты с толку, читая это? Если читать..

Предварительное обучение и тонкая настройка обработки естественного языка: революция в области

Предварительная подготовка и тонкая настройка — два важных метода в области обработки естественного языка (НЛП), которые произвели революцию в нашем подходе к задачам НЛП. Эти методы позволили исследователям достичь самых современных результатов в различных задачах НЛП, используя большие объемы данных и вычислительную мощность. В этом эссе я объясню, что такое предварительная подготовка и тонкая настройка, как они работают и какое влияние они оказали на исследования НЛП...