建模方法
谷歌拓展了在向量空间中表征语言(language)的构想,这一想法通过为像完整句子或段落为代表的较大语言块创建向量来实现。语言是由具有概念的层次结构组成的,因此团队采用模块的层次结构来构建向量,每一模块都要考虑与不同时间尺度序列所对应的特征。各种类型的关系,如关联、同/反义、部分/整体等都可以用向量空间语言表示。团队在论文《Efficient Natural Language Response for Smart Reply》有更多介绍。
以往我们在检索书籍时,通常会从书名、作者、主题等表面标签入手。而谷歌发布的「Talk to Books」可以为用户提供一种检索书籍的全新方法。用户只需要做一段相关描述,或是提一个相关的问题,那么 Talk to Books 可以在不依赖关键词匹配的情况下,从超过 10 万本书籍中检索所有句子,并根据句子层面的语义,找到能匹配用户陈述或问题的句子。从某种意义上来说,Talk to Books 是一种用户与书「交谈」的新模式,系统给出的回答也能帮助用户确定自己是否对相关主题感兴趣。