Семантика

  • Хабрахабр

    Схема против нейросети

    Мы снова недооцениваем сложность задач. Перцептрон известен нам уже более полувека. И мы до сих пор используем его в том же виде, лишь наращивая вычислительные мощности.Свёрточная нейронная сеть — математическая реализация зрительной подсистемы (палочки под разным углом и их иерархические комбинации в более сложные образы). В первом слое хватит и фильтра Собеля. Без обучения. Процесс упростится.По мне, так это давно…

    Подробнее »
  • Хабрахабр

    Самоучитель клингонского

    Пару лет назад мы рассказали о том, как в системе Антиплагиат устроен поиск русского перевода английских статей. Естественно, без машинного переводчика в алгоритме не обойтись. В основе машинного переводчика, конечно, лежит машинное обучение, которое, в свою очередь, требует весьма значительного количества «параллельных предложений», т.е. одинаковых по смыслу предложений, написанных на двух языках. Значительное количество — это миллионы предложений, и чем…

    Подробнее »
  • Хабрахабр

    Люди ломаются на логике, роботы — на всем понемногу. Экзамены по русскому для NLP-моделей

    Чтобы машины могли обрабатывать текст на русском и «понимать» его, в NLP используются универсальные языковые модели и трансформеры — BERT, RoBERTa, XLNet и другие — архитектуры от 100 миллионов параметров, обученные на миллиардах слов. Все оригинальные модели появляются обычно для английского, показывают state-of-the-art в какой-нибудь прикладной задаче и только спустя полгода-год появляются и для русского языка, без тюнинга архитектуры. Чтобы…

    Подробнее »
  • Хабрахабр

    Миф семантического веба

    В сфере семантического моделирования сложилась довольно странная ситуация: в качестве базовых используется набор стандартов и спецификаций от W3C, заточенных под проект “семантического веба” (RDF/OWL, SPARQL и пр.), хотя сам проект не только не реализован на данный момент, но и, по всей видимости, никогда не будет воплощен вследствие сомнительности исходных гипотез. Семантический веб мыслился его автором Тимом Бернерсом Ли как следующий…

    Подробнее »
  • Хабрахабр

    [Из песочницы] Метод нечеткой индукции и его применение для моделирования знаний и информационных систем

    В настоящей статье предложен разработанный автором метод нечеткой индукции как объединение положений нечеткой математики и теории фракталов, введено понятие степени рекурсии нечеткого множества, представлено описание неполной рекурсии множества как его дробной размерности для моделирования предметной области. В качестве сферы применения предлагаемого метода и созданных на его основе моделей знаний как нечетких множеств рассмотрено управление жизненным циклом информационных систем, включая разработку…

    Подробнее »
  • Хабрахабр

    Граф знаний в Поиске: построение из нескольких источников

    Я хочу рассказать о том, что такое граф знаний и об одном из способов его построения из нескольких тематических источников. Большое количество запросов в поиске содержат единственную сущность — объект, про который спрашивает пользователь. Это могут быть запросы про каких-то людей, фильмы, сериалы, музыкальные или географические объекты. Когда пользователь задает такой запрос, в выдаче ему можно показать дополнительную информационную карточку…

    Подробнее »
  • Хабрахабр

    Null проблема в Data Science и Machine Learning

    Существующее определение Null в Data Science сильно ограничено. Приложив немножко усилий? мы значительно улучшим обработку данных, ранее попадаемых в Null. Старая проблема — "Null" проблема. Она была сформулированна в статье Кодда в отношении семантики баз данных. Программисты должны прикладывать много усилий, чтобы обрабатывать Null значения. Наверное, поэтому они не любят Null и даже продвигали идею, что без Null можно обойтись.…

    Подробнее »
  • Хабрахабр

    [Перевод] XML практически всегда применяется не по назначению

    Язык XML был изобретен в 1996 году. Едва он успел появиться, как возможности его применения уже начали понимать неправильно, и для тех целей, к которым его пытались адаптировать, он был не лучшим выбором. Более того, такое применение XML свидетельствовало о фундаментальном непонимании того, чем прежде всего является XML. Не будет преувеличением сказать, что подавляющее большинство схем XML, которые мне доводилось…

    Подробнее »
  • Хабрахабр

    Применение сиамских нейросетей в поиске

    В этом посте я расскажу, какие подходы мы в Поиске Mail.ru используем для сравнения текстов. Всем привет! Как только мы научимся хорошо сравнивать разные тексты друг с другом, поисковая система сможет лучше понимать запросы пользователя. Для чего это нужно? Для начала строго поставить задачу. Что нам для этого нужно? В нашем случае будут сравниваться тексты пользовательских запросов с текстами документов.Задача…

    Подробнее »
  • Хабрахабр

    Как работать с Google Trends — полное руководство для новичков

    Привет, Хабр! Заметил, что многие не знают, как работать с трендами в интернете. И тем более, не знают о существовании бесплатного сервиса, решающего эту проблему- Google Trends Сервис поможет узнать, что волнует ваших клиентов сегодня, интересен ли ваш товар рынку, какая у него сезонность, в каком регионе наибольший интерес к товару и вашему конкуренту? Статья будет полезна специалистам, ранее не…

    Подробнее »


Кнопка «Наверх»
Закрыть