txtai 4.0 正式发布,构建 AI 驱动的语义搜索应用

栏目: 软件资讯 · 发布时间: 4年前

内容简介:txtai 4.0 已正式发布,这是一个具有大量新特性的重要版本,同时也会兼容旧版本,增加了诸如内容存储、对象存储、使用 SQL 查询、索引压缩、重新索引(reindexing)、外部向量等功能。 数据方面,新版发布之后,代码...

txtai 4.0 已正式发布,这是一个具有大量新特性的重要版本,同时也会兼容旧版本,增加了诸如内容存储、对象存储、使用 SQL 查询、索引压缩、重新索引(reindexing)、外部向量等功能。

数据方面,新版发布之后,代码量增加了 50%,解决了 36 个问题,据称是迄今为止最大的版本。

新特性

  • 支持存储文本内容(#168
  • 添加选项以索引内容字典(#169
  • 添加 SQL 支持以生成结合嵌入 (embedding) + 数据库查询 ( #170 )
  • 将 reindex 方法添加到嵌入(#171
  • 添加对索引存档的支持(#172
  • 为嵌入添加关闭方法(#173
  • 更新 API 以使用嵌入 + 数据库搜索 ( #176 )
  • 为表格管道 (tabular pipeline) 添加内容选项(#177
  • 更新工作流示例以支持嵌入内容 ( #179 )
  • 将索引元数据添加到嵌入配置(#180
  • 添加对象存储(#183
  • 聚类时会聚合部分查询结果(#184
  • 将函数参数添加到嵌入重新索引(#185
  • 添加对用户定义的列别名的支持(#186
  • 使用 SQL 括号表示法支持多词和更复杂的 JSON 路径表达式 ( #187 )
  • 支持 SQLite 3.22+ ( #190 )
  • 添加预先计算的向量支持(#192
  • 更改文档/对象插入以仅保留最新记录(#193
  • 更新包含 4.0 变化的文档 ( #196 )

改进

  • 修改工作流以选择带有切片的批处理 ( #158 )
  • 为工作流添加张量支持 ( #159 )
  • 如果作为文件路径提供,则读取 YAML 配置 ( #162 )
  • 向 API 添加管道更容易(#163
  • 支持同时处理任务动作(#164
  • 添加张量工作流 notebook(#167
  • 更新默认 ANN 参数 ( #174 )
  • 要求 Python 3.7+ ( #175 )
  • 一致地命名嵌入 id 字段(#178
  • 添加 txtai 版本属性(#181
  • 修改嵌入以仅对输入文档进行一次迭代(#189
  • 提升向量转换的效率 ( #191 )

Bugfix

  • 在 API 写入调用周围添加线程锁 ( #160 )
  • 通过 API 公开 caption 和 objects ( #161 )
  • 更改 pickle 调用以使用支持最低 Python 版本的协议 ( #182 )
  • HFOnnx 预期的 ORT provider 错误 ( #195 )

详情查看 release note

txtai 是一个人工智能驱动的搜索引擎,可以在文本的各个部分上建立了一个 AI 驱动的索引。 txtai 支持构建文本索引以执行相似性搜索并创建基于问-答的系统。此外,txtai 还具有用于 zero-shot 分类的功能。

txtai 4.0 正式发布,构建 AI 驱动的语义搜索应用


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

网络、群体与市场

网络、群体与市场

大卫·伊斯利(David Esley)、乔恩·克莱因伯格(Jon Kleinberg) / 李晓明、王卫红、杨韫利 / 清华大学出版社 / 2011-10-1 / CNY 69.00

过去十年来,现代社会中复杂的连通性向公众展现出与日俱增的魅力。这种连通性在许多方面都有体现并发挥着强大的作用,包括互联网的快速成长、全球通信的便捷,以及新闻与信息(及传染病与金融危机)以惊人的速度与强度传播的能力。这种现象涉及网络、动机和人们的聚合行为。网络将人们的行为联系起来,使得每个人的决定可能对他人产生微妙的后果。 本书是本科生的入门教材,同时也适合希望进入相关领域的高层次读者。它从交......一起来看看 《网络、群体与市场》 这本书的介绍吧!

JSON 在线解析
JSON 在线解析

在线 JSON 格式化工具

SHA 加密
SHA 加密

SHA 加密工具

html转js在线工具
html转js在线工具

html转js在线工具