Подразделение B2B Tech компании Яндекс выпустило новую версию СУБД (система управления базами данных) YDB. В ней появился векторный поиск, технология, которая ищет данные по смыслу, а не по ключевым словам. Векторный поиск особенно пригодится компаниям, которые развивают продукты на базе ИИ (искусственного интеллекта), но не только им. Так, с ее помощью можно повысить точность рекомендаций товаров или точность ответов ИИ-ассистента. Причем доступен векторный поиск как локально, по модели on-premises, так и в облаке.
Суть технологии проста: она представляет данные в виде числовых векторов или эмбеддингов. Сравнивая векторы, можно определить семантическую близость соответствующих им объектов. Это дает возможность устанавливать неочевидные связи между объектами, а также искать по разнородным данным, вроде текстов, картинок, видео или аудиофайлов. Также такая система значительно устойчивее к ошибкам и опечаткам.
«Сейчас ИИ-ассистентов внедряют у себя компании практически из всех отраслей. Наша технология позволяет создавать ассистентов на архитектуре RAG (Retrieval-Augmented Generation) — когда ответ большой языковой модели дополняется данными из баз знаний. В таких базах может содержаться, например, документация к продукту или ответы поддержки. Векторный поиск позволяет находить в базах необходимую информацию и добавлять её в ответы LLM. Это означает, что ассистент будет давать более полные, релевантные и актуальные ответы без какого-либо дообучения большой языковой модели», — говорит Андрей Фомичев, технический директор YDB.
Больше статей и видео в нашем Дзен-канале
Технологию векторного поиска уже применили в Алисе, она доступна пользователям опции «Про». С ней можно попросить Алису учитывать свои предпочтения и интересы при составлении ответов, таким образом она подстраивается под пользователя и ведет «персонализированный диалог» — почти как живой собеседник.
В новой YDB доступно две версии векторного поиска: точная и приближенная. Точный поиск обеспечивает наилучший результат, однако требует сложных вычислений, если данных много. Приближенный же поиск может обрабатывать миллиарды векторов за десятки-сотни миллисекунд, даже корпус векторов не помещается в оперативную память. Как сообщает Яндекс, такую возможность предоставляют всего несколько компаний в мире.
YDB развивает векторный поиск при поддержке созданного Яндексом Фонда технологических инициатив YATF, который вкладывается в новаторские проекты внутри компании — такие, которые способны продвинуть вперед науку и технологии. В 2025 году на это выделено 330 миллионов рублей.