Публикации по теме 'nlp'
Математика алгоритма TextRank
TextRank, PageRank в деталях с реализацией Numpy.
Цель — Математика, лежащая в основе TextRank, PageRank подробно объясняется с реализацией Numpy и используется для создания сводки.
TextRank — графическая модель ранжирования для обработки текста, которую можно использовать для поиска наиболее релевантных предложений в текстовых документах.
Приложение
Извлекательное обобщение , а также для поиска ключевых слов/фраз .
Рассматриваемая тема
Объяснение PageRank Объяснение..
НЛП в Python - векторизация
Общие методы векторизации, используемые в типичном конвейере модели машинного обучения НЛП с использованием набора данных реальных фейковых новостей от Kaggle.
В этой статье мы узнаем о векторизации и различных методах векторизации, используемых в модели НЛП. Затем мы применим эти концепции к контексту проблемы.
Мы будем работать с набором данных, который классифицирует новости как поддельные или настоящие. Набор данных доступен на Kaggle, ссылка на набор данных находится ниже:..
Крушение искусственного интеллекта
При правильном обучении искусственный интеллект (ИИ) может выполнять задачи намного точнее и точнее , чем люди. Это не новость, поскольку это наблюдается во многих отраслях, например в автономных транспортных средствах. Вся цель разработки беспилотных автомобилей - это акцент на аспект безопасности технологии, все благодаря точным движениям, рассчитываемым ИИ.
По сути, этот ИИ действует как человек, задавая вопросы, например, впереди левый поворот, приближаются ли какие-нибудь машины?..
Когда еда встречает искусственный интеллект: проект умных рецептов
Когда еда встречает искусственный интеллект: проект умных рецептов
Оскар Уайльд сказал: «Я терпеть не могу людей, которые не относятся к еде серьезно», и мы полностью с ним согласны. Еда - одна из важнейших вещей, с которыми мы сталкиваемся каждый день, и не только потому, что это наш главный источник выживания. Кулинарные рецепты, видео и фотографии повсюду в сети, которая на сегодняшний день является крупнейшим архивом контента, связанного с едой.
Но что, если этот большой объем..
Мягкое введение в Doc2Vec
TL;DR
В этом посте вы узнаете, что такое doc2vec , как он построен, как он связан с word2vec , что вы можете с ним делать, надеюсь, без математических формул.
Хотите узнать больше? посетите www.shibumi-ai.com
вступление
Числовое представление текстовых документов - сложная задача в машинном обучении. Такое представление может использоваться для многих целей, например: поиск документов, веб-поиск, фильтрация спама, моделирование тем и т. Д.
Однако для этого не так много..
Но как именно работают трансформаторы?
Внимание — это все, что вам нужно!
«У Индии очень хорошие отношения с Россией. Вместе с ними было закуплено множество новейших технологий. У Японии тоже хорошие отношения, но ни одна страна не заменила прежние».
Вышеупомянутые строки могут вызвать путаницу в любой модели машинного обучения, когда речь идет о следующих словах: «ЭТО», «ИХ», «БЫВШИЙ». В абзаце указаны три страны, и модели путаются, о чем говорят эти слова.
Но разве мы сбиты с толку, читая это? Если читать..
Предварительное обучение и тонкая настройка обработки естественного языка: революция в области
Предварительная подготовка и тонкая настройка — два важных метода в области обработки естественного языка (НЛП), которые произвели революцию в нашем подходе к задачам НЛП. Эти методы позволили исследователям достичь самых современных результатов в различных задачах НЛП, используя большие объемы данных и вычислительную мощность. В этом эссе я объясню, что такое предварительная подготовка и тонкая настройка, как они работают и какое влияние они оказали на исследования НЛП...