Переглядів 22,621
00:00:03 引子
00:01:43 给大模型增加记忆的三种方式
00:02:36 向量数据库的应用场景
00:06:58 向量embedding和搜索的演化历程
00:17:05 Pinecone的发展历程
00:27:11 Pinecone的竞争对手
00:34:04 两个问题
每天当我们睁开双眼,记录光线强度的信号传到视觉皮层,那里的神经元激活后形成对眼前事物的神经表征,这就是人脑真正理解和学习的对象。AI 模型的学习原理也并无二致,它实际识别和理解的不是一个个具体的文字符号,而是神经网络对各类数据的向量化表示,表示的结果便是向量 embedding 。在 AI 重塑软件的时代,向量作为大模型理解世界的数据形式,也可能促成新的重要基建:向量数据库。如果说 LLM 是容易失忆的大脑,向量数据库就是海马体,像 AutoGPT 这样需要记忆系统的多轮项目正在涌现,向量数据库的用量也陡然增长。其中增长最快的就是 Pinecone,他们用开箱即用的产品体验占据了 AI 应用开发者的心智。随着多模态大模型的出现,向量 embedding 会像 JSON 数据一样覆盖多个使用场景,需求量也将大幅增长。
#向量数据库 #vectordatabase #pinecone #machinelearning