(12)发明专利申请
(10)申请公布号 CN 105574173 A (43)申请公布日 2016.05.11
(21)申请号 201510958874.2(22)申请日 2015.12.18
(71)申请人畅捷通信息技术股份有限公司
地址100094 北京市海淀区北清路68号用
友软件园(72)发明人黄通文 薛会萍
(74)专利代理机构北京友联知识产权代理事务
所(普通合伙) 11343
代理人尚志峰 汪海屏(51)Int.Cl.
G06F 17/30(2006.01)G10L 15/26(2006.01)
权利要求书2页 说明书10页 附图2页
(54)发明名称
基于语音识别的商品搜索方法及商品搜索装置(57)摘要
本发明提供了一种基于语音识别的商品搜索方法及商品搜索装置,其中,所述基于语音识别的商品搜索方法,包括:识别用户输入的语音信息,以生成与所述语音信息对应的字符信息;根据查找时所依据的商品信息来源和所述字符信息中的关键字,预先设置不同优先级的多个查找模式;根据所述多个查找模式的优先级以及所述多个查找模式,查找与所述字符信息匹配的目标商品,并输出所述目标商品。通过本发明的技术方案,在用户通过语音搜索商品的过程中,通过不同优先级别的查找模式来逐步搜索查找目标商品,大大增加查找到目标商品的概率,使得即便识别到的字符信息和目标商品差异较大时,也能确保搜索到对应商品,提升了用户的使用体验。
C N 1 0 5 5 7 4 1 7 3 ACN 105574173 A
权 利 要 求 书
1/2页
1.一种基于语音识别的商品搜索方法,其特征在于,包括:识别用户输入的语音信息,以生成与所述语音信息对应的字符信息;根据查找时所依据的商品信息来源和所述字符信息中的关键字,预先设置不同优先级的多个查找模式;
根据所述多个查找模式的优先级以及所述多个查找模式,查找与所述字符信息匹配的目标商品,并输出所述目标商品。
2.根据权利要求1所述的基于语音识别的商品搜索方法,其特征在于,根据所述多个查找模式的优先级以及所述多个查找模式,查找与所述字符信息匹配的目标商品的步骤具体包括:
在预设的第一商品信息库中,查找与所述字符信息中的全部字符或全部字符的全拼或
以将查找到的所述第一商品作为所述目标商品。全部字符的简拼匹配的第一商品,
3.根据权利要求2所述的基于语音识别的商品搜索方法,其特征在于,还包括:检测是否能够查找到所述第一商品;在确定查找不到所述第一商品时,在预设的第二商品信息库中,查找与所述字符信息中的全部字符或全部字符的全拼或全部字符的简拼匹配的第二商品,以将查找到的所述第二商品作为所述目标商品。
4.根据权利要求3所述的基于语音识别的商品搜索方法,其特征在于,还包括:检测是否能够查找到所述第二商品;在确定查找不到所述第二商品时,对所述字符信息中的全部字符、全部字符的全拼和全部字符的简拼进行多元分解,以得到多个查找时所依据的所述关键字;
根据所述关键字查找相似度大于预设阈值的第三商品,以将查找到的所述第三商品作为所述目标商品。
5.根据权利要求4所述的基于语音识别的商品搜索方法,其特征在于,还包括:检测是否能够查找到所述第三商品;在确定查找不到所述第三商品时,对所述字符信息进行模糊匹配,以确定对应的候选品牌集和候选品类集;
将所述候选品牌集中的任一品牌和所述候选品类集中的任一品类进行搭配组合,并查找搭配组合度最高的第四商品,以将查找到的所述第四商品作为所述目标商品。
6.一种基于语音识别的商品搜索装置,其特征在于,包括:语音识别单元,用于识别用户输入的语音信息,以生成与所述语音信息对应的字符信息;
设置单元,用于根据查找时所依据的商品信息来源和所述字符信息中的关键字,预先设置不同优先级的多个查找模式;
处理单元,用于根据所述多个查找模式的优先级以及所述多个查找模式,查找与所述字符信息匹配的目标商品,并输出所述目标商品。
7.根据权利要求6所述的基于语音识别的商品搜索装置,其特征在于,所述处理单元包括:
第一查找单元,用于在预设的第一商品信息库中,查找与所述字符信息中的全部字符或全部字符的全拼或全部字符的简拼匹配的第一商品,以将查找到的所述第一商品作为所
2
CN 105574173 A
权 利 要 求 书
2/2页
述目标商品。
8.根据权利要求7所述的基于语音识别的商品搜索装置,其特征在于,所述处理单元还包括:
第一检测单元,检测是否能够查找到所述第一商品;第二查找单元,用于在所述第一检测单元确定查找不到所述第一商品时,在预设的第二商品信息库中,查找与所述字符信息中的全部字符或全部字符的全拼或全部字符的简拼匹配的第二商品,以将查找到的所述第二商品作为所述目标商品。
9.根据权利要求8所述的基于语音识别的商品搜索装置,其特征在于,所述处理单元还包括:
第二检测单元,用于检测是否能够查找到所述第二商品;获取单元,用于在所述第二检测单元确定查找不到所述第二商品时,对所述字符信息中的全部字符、全部字符的全拼和全部字符的简拼进行多元分解,以得到多个查找时所依据的所述关键字;
第三查找单元,用于根据所述关键字查找相似度大于预设阈值的第三商品,以将查找到的所述第三商品作为所述目标商品。
10.根据权利要求9所述的基于语音识别的商品搜索装置,其特征在于,所述处理单元还包括:
第三检测单元,用于检测是否能够查找到所述第三商品;确认单元,用于在所述第三检测单元确定查找不到所述第三商品时,对所述字符信息进行模糊匹配,以确定对应的候选品牌集和候选品类集;
第四查找单元,用于将所述候选品牌集中的任一品牌和所述候选品类集中的任一品类进行搭配组合,并查找搭配组合度最高的第四商品,以将查找到的所述第四商品作为所述目标商品。
3
CN 105574173 A
说 明 书
基于语音识别的商品搜索方法及商品搜索装置
1/10页
技术领域
[0001]本发明涉及信息处理技术领域,具体而言,涉及一种基于语音识别的商品搜索方法和一种基于语音识别的商品搜索装置。
背景技术
[0002]用户在使用ERP(Enterprise Resource Planning,企业资源计划)移动应用进行商品下单服务时,传统的下单模式由于选存货太慢,导致下单效率较低,为改变传统的下单方式,在相关技术中,借助语音搜索的方式进行搜索,以提高对商品的下单效率。[0003]但在实际应用中,由于实际企业的商品存货中名称各异,有中文,有数字,有字母,有特殊字符等,商品的品牌名称也是比较繁杂,且当语音识别得到的文字信息和要搜索的商品差别比较大时,比如“三五麻辣鱼”中的“麻辣鱼”语音识别为“马来语”等,语音识别很难做到针对企业领域不同商品类型的名称进行识别,大大降低了搜索的准确性和效率,影响用户的使用体验。[0004]因此,如何确保通过语音能够搜索到对应商品成为亟待解决的技术问题。发明内容
[0005]本发明正是基于上述技术问题至少之一,提出了一种新的基于语音识别的商品搜索方案,在用户通过语音搜索商品的过程中,通过不同优先级别的查找模式来逐步搜索查找目标商品,大大增加查找到目标商品的概率,使得即便识别到的字符信息和目标商品差异较大时,也能确保搜索到对应商品,提升了用户的使用体验。[0006]有鉴于此,本发明提出了一种基于语音识别的商品搜索方法,包括:识别用户输入的语音信息,以生成与所述语音信息对应的字符信息;根据查找时所依据的商品信息来源和所述字符信息中的关键字,预先设置不同优先级的多个查找模式;根据所述多个查找模式的优先级以及所述多个查找模式,查找与所述字符信息匹配的目标商品,并输出所述目标商品。
[0007]在该技术方案中,由于语音识别本身的局限性和用户自身的发音问题,当用户通过语音输入某个商品名称时,可能识别出的字符信息和用户实际需要的商品差别较大,若直接根据识别出的字符信息进行查找,可能就搜索不到对应的商品,所以通过根据查找时所依据的商品信息来源和字符信息中的关键字,预先设置不同优先级的多个查找模式,并根据多个查找模式的优先级以及多个查找模式,查找与字符信息匹配的目标商品,增加了查找到目标商品的概率,使得即便识别到的字符信息和目标商品差异较大时,也能确保搜索到对应商品,提升了用户的使用体验。[0008]在上述技术方案中,优选地,根据所述多个查找模式的优先级以及所述多个查找模式,查找与所述字符信息匹配的目标商品的步骤具体包括:在预设的第一商品信息库中,查找与所述字符信息中的全部字符或全部字符的全拼或全部字符的简拼匹配的第一商品,以将查找到的所述第一商品作为所述目标商品。
4
CN 105574173 A[0009]
说 明 书
2/10页
在该技术方案中,通过在预设的第一商品信息库中,查找与字符信息中的全部字
符或全部字符的全拼或全部字符的简拼匹配的第一商品,以将查找到的第一商品作为目标商品,整个查找过程的匹配条件比较严格,以实现准确查找。[0010]具体地,比如,用户在进行语音搜索时,识别到的字符信息为“春荣寂静”,而用户实际需要搜索的商品为“春蓉鸡精”,此时通过商品“春蓉鸡精”所在的企业数据库(即第一商品信息库),查询是否有全部字符的全拼“chunrongjijing”或全部字符的简拼“chrjj”来搜索是否有相匹配的发音的商品,若有,则直接输出该商品。[0011]在上述任一项技术方案中,优选地,还包括:检测是否能够查找到所述第一商品;在确定查找不到所述第一商品时,在预设的第二商品信息库中,查找与所述字符信息中的全部字符或全部字符的全拼或全部字符的简拼匹配的第二商品,以将查找到的所述第二商品作为所述目标商品。
[0012]在该技术方案中,可能第一商品信息库中未存储用户希望查找的某品牌的商品,就可以通过调用第二商品信息库中商品信息,查找与字符信息中的全部字符或全部字符的全拼或全部字符的简拼匹配的第二商品,以将查找到的第二商品作为目标商品,以满足用户的查找需求。
[0013]在上述任一项技术方案中,优选地,还包括:检测是否能够查找到所述第二商品;在确定查找不到所述第二商品时,对所述字符信息中的全部字符、全部字符的全拼和全部字符的简拼进行多元分解,以得到多个查找时所依据的所述关键字;根据所述关键字查找相似度大于预设阈值的第三商品,以将查找到的所述第三商品作为所述目标商品。[0014]在该技术方案中,通过对字符信息中的全部字符、全部字符的全拼和全部字符的简拼进行多元分解,以得到多个查找时所依据的关键字,并根据关键字查找相似度大于预设阈值的第三商品,使得当识别到的字符信息与实际商品差别较大,通过多个关键字搜索匹配,以增加查找到对应商品的概率,具体地,在用户希望查找商品“花之语杭白菊”时,而识别到的字符信息为“话剧行白居”,就可以对“话剧行白居”的字符和对应拼音或简拼进行一元、二元、三元分词,每个分词都可以是关键字,来进行全方位匹配搜索并计算对应的相似度,相似度越高,说明可能就是目标商品,使得即便识别到的字符信息和目标商品差异较大时,也能确保搜索到对应商品,提升了用户的使用体验。[0015]在上述任一项技术方案中,优选地,还包括:检测是否能够查找到所述第三商品;在确定查找不到所述第三商品时,对所述字符信息进行模糊匹配,以确定对应的候选品牌集和候选品类集;将所述候选品牌集中的任一品牌和所述候选品类集中的任一品类进行搭配组合,并查找搭配组合度最高的第四商品,以将查找到的所述第四商品作为所述目标商品。
[0016]在该技术方案中,若查找不到第三商品,说明识别到的字符信息和实际的商品之间差异很大,通过关键字已不足以确定字符信息对应的商品,此时可以通过对字符信息进行模糊匹配,通过投票的方式确定对应的候选品牌集和候选品类集,以及将候选品牌集中的任一品牌和候选品类集中的任一品类进行搭配组合,并使用互信息的方法查找搭配组合度最高的第四商品,具体地,比如用户希望查找商品“脉动青柠运动饮料”,而识别到的字符信息为“买多起立云朵银鹭”,通过确认“买多起立云朵银鹭”可能包含有“麦多、脉动、银鹭”等品牌,以及“洗衣液、饮料、火锅”等品类,并将品牌和品类进行搭配,找出搭配组合度最高
5
CN 105574173 A
说 明 书
3/10页
的“脉动饮料”作为目标商品,避免根据语音识别不到商品的尴尬局面,提升了用户的使用体验。
[0017]根据本发明的第二方面,还提出一种基于语音识别的商品搜索装置,包括:语音识别单元,用于识别用户输入的语音信息,以生成与所述语音信息对应的字符信息;设置单元,用于根据查找时所依据的商品信息来源和所述字符信息中的关键字,预先设置不同优先级的多个查找模式;处理单元,用于根据所述多个查找模式的优先级以及所述多个查找模式,查找与所述字符信息匹配的目标商品,并输出所述目标商品。[0018]在该技术方案中,由于语音识别本身的局限性和用户自身的发音问题,当用户通过语音输入某个商品名称时,可能识别出的字符信息和用户实际需要的商品差别较大,若直接根据识别出的字符信息进行查找,可能就搜索不到对应的商品,所以通过根据查找时所依据的商品信息来源和字符信息中的关键字,预先设置不同优先级的多个查找模式,并根据多个查找模式的优先级以及多个查找模式,查找与字符信息匹配的目标商品,增加了查找到目标商品的概率,使得即便识别到的字符信息和目标商品差异较大时,也能确保搜索到对应商品,提升了用户的使用体验。[0019]在上述技术方案中,优选地,所述处理单元包括:第一查找单元,用于在预设的第一商品信息库中,查找与所述字符信息中的全部字符或全部字符的全拼或全部字符的简拼匹配的第一商品,以将查找到的所述第一商品作为所述目标商品。[0020]在该技术方案中,通过在预设的第一商品信息库中,查找与字符信息中的全部字符或全部字符的全拼或全部字符的简拼匹配的第一商品,以将查找到的第一商品作为目标商品,整个查找过程的匹配条件比较严格,以实现准确查找。[0021]具体地,比如,用户在进行语音搜索时,识别到的字符信息为“春荣寂静”,而用户实际需要搜索的商品为“春蓉鸡精”,此时通过商品“春蓉鸡精”所在的企业数据库(即第一商品信息库),查询是否有全部字符的全拼“chunrongjijing”或全部字符的简拼“chrjj”来搜索是否有相匹配的发音的商品,若有,则直接输出该商品。[0022]在上述任一项技术方案中,优选地,所述处理单元还包括:第一检测单元,检测是否能够查找到所述第一商品;第二查找单元,用于在所述第一检测单元确定查找不到所述第一商品时,在预设的第二商品信息库中,查找与所述字符信息中的全部字符或全部字符的全拼或全部字符的简拼匹配的第二商品,以将查找到的所述第二商品作为所述目标商品。
[0023]在该技术方案中,可能第一商品信息库中未存储用户希望查找的某品牌的商品,就可以通过调用第二商品信息库中商品信息,查找与字符信息中的全部字符或全部字符的全拼或全部字符的简拼匹配的第二商品,以将查找到的第二商品作为目标商品,以满足用户的查找需求。
[0024]在上述任一项技术方案中,优选地,所述处理单元还包括:第二检测单元,用于检测是否能够查找到所述第二商品;获取单元,用于在所述第二检测单元确定查找不到所述第二商品时,对所述字符信息中的全部字符、全部字符的全拼和全部字符的简拼进行多元分解,以得到多个查找时所依据的所述关键字;第三查找单元,用于根据所述关键字查找相似度大于预设阈值的第三商品,以将查找到的所述第三商品作为所述目标商品。[0025]在该技术方案中,通过对字符信息中的全部字符、全部字符的全拼和全部字符的
6
CN 105574173 A
说 明 书
4/10页
简拼进行多元分解,以得到多个查找时所依据的关键字,并根据关键字查找相似度大于预设阈值的第三商品,使得当识别到的字符信息与实际商品差别较大,通过多个关键字搜索匹配,以增加查找到对应商品的概率,具体地,在用户希望查找商品“花之语杭白菊”时,而识别到的字符信息为“话剧行白居”,就可以对“话剧行白居”的字符和对应拼音或简拼进行一元、二元、三元分词,每个分词都可以是关键字,来进行全方位匹配搜索并计算对应的相似度,相似度越高,说明可能就是目标商品,使得即便识别到的字符信息和目标商品差异较大时,也能确保搜索到对应商品,提升了用户的使用体验。[0026]在上述任一项技术方案中,优选地,所述处理单元还包括:第三检测单元,用于检测是否能够查找到所述第三商品;确认单元,用于在所述第三检测单元确定查找不到所述第三商品时,对所述字符信息进行模糊匹配,以确定对应的候选品牌集和候选品类集;第四查找单元,用于将所述候选品牌集中的任一品牌和所述候选品类集中的任一品类进行搭配组合,并查找搭配组合度最高的第四商品,以将查找到的所述第四商品作为所述目标商品。[0027]在该技术方案中,若查找不到第三商品,说明识别到的字符信息和实际的商品之间差异很大,通过关键字已不足以确定字符信息对应的商品,此时可以通过对字符信息进行模糊匹配,通过投票的方式确定对应的候选品牌集和候选品类集,以及将候选品牌集中的任一品牌和候选品类集中的任一品类进行搭配组合,并使用互信息的方法查找搭配组合度最高的第四商品,具体地,比如用户希望查找商品“脉动青柠运动饮料”,而识别到的字符信息为“买多起立云朵银鹭”,通过确认“买多起立云朵银鹭”可能包含有“麦多、脉动、银鹭”等品牌,以及“洗衣液、饮料、火锅”等品类,并将品牌和品类进行搭配,找出搭配组合度最高的“脉动饮料”作为目标商品,避免根据语音识别不到商品的尴尬局面,提升了用户的使用体验。
[0028]通过以上技术方案,在用户通过语音搜索商品的过程中,通过不同优先级别的查找模式来逐步搜索查找目标商品,大大增加查找到目标商品的概率,使得即便识别到的字符信息和目标商品差异较大时,也能确保搜索到对应商品,提升了用户的使用体验。附图说明
[0029]图1示出了根据本发明的实施例的基于语音识别的商品搜索方法的示意流程图;[0030]图2示出了根据本发明的实施例的基于语音识别的商品搜索装置的示意框图;[0031]图3示出了根据本发明的实施例的用户基于语音搜索商品的交互示意图;
[0032]图4示出了根据本发明的实施例的通过语音纠错与识别进行商品搜索的处理流程图。
具体实施方式
[0033]为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实
需要说明的是,在不冲突的情况下,本申请的实施施方式对本发明进行进一步的详细描述。
例及实施例中的特征可以相互组合。
[0034]在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的。
7
CN 105574173 A[0035]
说 明 书
5/10页
图1示出了根据本发明的实施例的基于语音识别的商品搜索方法的示意流程图。
[0036]如图1所示,根据本发明的实施例的基于语音识别的商品搜索方法,包括:[0037]步骤102,识别用户输入的语音信息,以生成与所述语音信息对应的字符信息;[0038]步骤104,根据查找时所依据的商品信息来源和所述字符信息中的关键字,预先设置不同优先级的多个查找模式;[0039]步骤106,根据所述多个查找模式的优先级以及所述多个查找模式,查找与所述字符信息匹配的目标商品,并输出所述目标商品。[0040]在该技术方案中,由于语音识别本身的局限性和用户自身的发音问题,当用户通过语音输入某个商品名称时,可能识别出的字符信息和用户实际需要的商品差别较大,若直接根据识别出的字符信息进行查找,可能就搜索不到对应的商品,所以通过根据查找时所依据的商品信息来源和字符信息中的关键字,预先设置不同优先级的多个查找模式,并根据多个查找模式的优先级以及多个查找模式,查找与字符信息匹配的目标商品,增加了查找到目标商品的概率,使得即便识别到的字符信息和目标商品差异较大时,也能确保搜索到对应商品,提升了用户的使用体验。[0041]在上述技术方案中,优选地,步骤106具体包括:在预设的第一商品信息库中,查找与所述字符信息中的全部字符或全部字符的全拼或全部字符的简拼匹配的第一商品,以将查找到的所述第一商品作为所述目标商品。[0042]在该技术方案中,通过在预设的第一商品信息库中,查找与字符信息中的全部字符或全部字符的全拼或全部字符的简拼匹配的第一商品,以将查找到的第一商品作为目标商品,整个查找过程的匹配条件比较严格,以实现准确查找。[0043]具体地,比如,用户在进行语音搜索时,识别到的字符信息为“春荣寂静”,而用户实际需要搜索的商品为“春蓉鸡精”,此时通过商品“春蓉鸡精”所在的企业数据库(即第一商品信息库),查询是否有全部字符的全拼“chunrongjijing”或全部字符的简拼“chrjj”来搜索是否有相匹配的发音的商品,若有,则直接输出该商品。[0044]在上述任一项技术方案中,优选地,还包括:检测是否能够查找到所述第一商品;在确定查找不到所述第一商品时,在预设的第二商品信息库中,查找与所述字符信息中的全部字符或全部字符的全拼或全部字符的简拼匹配的第二商品,以将查找到的所述第二商品作为所述目标商品。
[0045]在该技术方案中,可能第一商品信息库中未存储用户希望查找的某品牌的商品,就可以通过调用第二商品信息库中商品信息,查找与字符信息中的全部字符或全部字符的全拼或全部字符的简拼匹配的第二商品,以将查找到的第二商品作为目标商品,以满足用户的查找需求。
[0046]在上述任一项技术方案中,优选地,还包括:检测是否能够查找到所述第二商品;在确定查找不到所述第二商品时,对所述字符信息中的全部字符、全部字符的全拼和全部字符的简拼进行多元分解,以得到多个查找时所依据的所述关键字;根据所述关键字查找相似度大于预设阈值的第三商品,以将查找到的所述第三商品作为所述目标商品。[0047]在该技术方案中,通过对字符信息中的全部字符、全部字符的全拼和全部字符的简拼进行多元分解,以得到多个查找时所依据的关键字,并根据关键字查找相似度大于预设阈值的第三商品,使得当识别到的字符信息与实际商品差别较大,通过多个关键字搜索
8
CN 105574173 A
说 明 书
6/10页
匹配,以增加查找到对应商品的概率,具体地,在用户希望查找商品“花之语杭白菊”时,而识别到的字符信息为“话剧行白居”,就可以对“话剧行白居”的字符和对应拼音或简拼进行一元、二元、三元分词,每个分词都可以是关键字,来进行全方位匹配搜索并计算对应的相似度,相似度越高,说明可能就是目标商品,使得即便识别到的字符信息和目标商品差异较大时,也能确保搜索到对应商品,提升了用户的使用体验。[0048]在上述任一项技术方案中,优选地,还包括:检测是否能够查找到所述第三商品;在确定查找不到所述第三商品时,对所述字符信息进行模糊匹配,以确定对应的候选品牌集和候选品类集;将所述候选品牌集中的任一品牌和所述候选品类集中的任一品类进行搭配组合,并查找搭配组合度最高的第四商品,以将查找到的所述第四商品作为所述目标商品。
[0049]在该技术方案中,若查找不到第三商品,说明识别到的字符信息和实际的商品之间差异很大,通过关键字已不足以确定字符信息对应的商品,此时可以通过对字符信息进行模糊匹配,通过投票的方式确定对应的候选品牌集和候选品类集,以及将候选品牌集中的任一品牌和候选品类集中的任一品类进行搭配组合,并使用互信息的方法查找搭配组合度最高的第四商品,具体地,比如用户希望查找商品“脉动青柠运动饮料”,而识别到的字符信息为“买多起立云朵银鹭”,通过确认“买多起立云朵银鹭”可能包含有“麦多、脉动、银鹭”等品牌,以及“洗衣液、饮料、火锅”等品类,并将品牌和品类进行搭配,找出搭配组合度最高的“脉动饮料”作为目标商品,避免根据语音识别不到商品的尴尬局面,提升了用户的使用体验。
[0050]图2示出了根据本发明的实施例的基于语音识别的商品搜索装置的示意框图。[0051]如图2所示,包括:根据本发明的实施例的基于语音识别的商品搜索装置200,[0052]其中,语音识别单元202,用于识别用户输入的语音信息,以生成与所述语音信息对应的字符信息;设置单元204,用于根据查找时所依据的商品信息来源和所述字符信息中的关键字,预先设置不同优先级的多个查找模式;处理单元206,用于根据所述多个查找模式的优先级以及所述多个查找模式,查找与所述字符信息匹配的目标商品,并输出所述目标商品。
[0053]在该技术方案中,由于语音识别本身的局限性和用户自身的发音问题,当用户通过语音输入某个商品名称时,可能识别出的字符信息和用户实际需要的商品差别较大,若直接根据识别出的字符信息进行查找,可能就搜索不到对应的商品,所以通过根据查找时所依据的商品信息来源和字符信息中的关键字,预先设置不同优先级的多个查找模式,并根据多个查找模式的优先级以及多个查找模式,查找与字符信息匹配的目标商品,增加了查找到目标商品的概率,使得即便识别到的字符信息和目标商品差异较大时,也能确保搜索到对应商品,提升了用户的使用体验。[0054]在上述技术方案中,优选地,所述处理单元206包括:第一查找单元206A,用于在预设的第一商品信息库中,查找与所述字符信息中的全部字符或全部字符的全拼或全部字符的简拼匹配的第一商品,以将查找到的所述第一商品作为所述目标商品。[0055]在该技术方案中,通过在预设的第一商品信息库中,查找与字符信息中的全部字符或全部字符的全拼或全部字符的简拼匹配的第一商品,以将查找到的第一商品作为目标商品,整个查找过程的匹配条件比较严格,以实现准确查找。
9
CN 105574173 A[0056]
说 明 书
7/10页
具体地,比如,用户在进行语音搜索时,识别到的字符信息为“春荣寂静”,而用户
实际需要搜索的商品为“春蓉鸡精”,此时通过商品“春蓉鸡精”所在的企业数据库(即第一商品信息库),查询是否有全部字符的全拼“chunrongjijing”或全部字符的简拼“chrjj”来搜索是否有相匹配的发音的商品,若有,则直接输出该商品。[0057]在上述任一项技术方案中,优选地,所述处理单元206还包括:第一检测单元206B,检测是否能够查找到所述第一商品;第二查找单元206C,用于在所述第一检测单元206B确定查找不到所述第一商品时,在预设的第二商品信息库中,查找与所述字符信息中的全部字符或全部字符的全拼或全部字符的简拼匹配的第二商品,以将查找到的所述第二商品作为所述目标商品。
[0058]在该技术方案中,可能第一商品信息库中未存储用户希望查找的某品牌的商品,就可以通过调用第二商品信息库中商品信息,查找与字符信息中的全部字符或全部字符的全拼或全部字符的简拼匹配的第二商品,以将查找到的第二商品作为目标商品,以满足用户的查找需求。
[0059]在上述任一项技术方案中,优选地,所述处理单元206还包括:第二检测单元206D,用于检测是否能够查找到所述第二商品;获取单元206E,用于在所述第二检测单元206D确定查找不到所述第二商品时,对所述字符信息中的全部字符、全部字符的全拼和全部字符的简拼进行多元分解,以得到多个查找时所依据的所述关键字;第三查找单元206F,用于根据所述关键字查找相似度大于预设阈值的第三商品,以将查找到的所述第三商品作为所述目标商品。
[0060]在该技术方案中,通过对字符信息中的全部字符、全部字符的全拼和全部字符的简拼进行多元分解,以得到多个查找时所依据的关键字,并根据关键字查找相似度大于预设阈值的第三商品,使得当识别到的字符信息与实际商品差别较大,通过多个关键字搜索匹配,以增加查找到对应商品的概率,具体地,在用户希望查找商品“花之语杭白菊”时,而识别到的字符信息为“话剧行白居”,就可以对“话剧行白居”的字符和对应拼音或简拼进行一元、二元、三元分词,每个分词都可以是关键字,来进行全方位匹配搜索并计算对应的相似度,相似度越高,说明可能就是目标商品,使得即便识别到的字符信息和目标商品差异较大时,也能确保搜索到对应商品,提升了用户的使用体验。[0061]在上述任一项技术方案中,优选地,所述处理单元206还包括:第三检测单元206G,用于检测是否能够查找到所述第三商品;确认单元206H,用于在所述第三检测单元206G确定查找不到所述第三商品时,对所述字符信息进行模糊匹配,以确定对应的候选品牌集和候选品类集;第四查找单元206I,用于将所述候选品牌集中的任一品牌和所述候选品类集中的任一品类进行搭配组合,并查找搭配组合度最高的第四商品,以将查找到的所述第四商品作为所述目标商品。[0062]在该技术方案中,若查找不到第三商品,说明识别到的字符信息和实际的商品之间差异很大,通过关键字已不足以确定字符信息对应的商品,此时可以通过对字符信息进行模糊匹配,通过投票的方式确定对应的候选品牌集和候选品类集,以及将候选品牌集中的任一品牌和候选品类集中的任一品类进行搭配组合,并使用互信息的方法查找搭配组合度最高的第四商品,具体地,比如用户希望查找商品“脉动青柠运动饮料”,而识别到的字符信息为“买多起立云朵银鹭”,通过确认“买多起立云朵银鹭”可能包含有“麦多、脉动、银鹭”
10
CN 105574173 A
说 明 书
8/10页
等品牌,以及“洗衣液、饮料、火锅”等品类,并将品牌和品类进行搭配,找出搭配组合度最高的“脉动饮料”作为目标商品,避免根据语音识别不到商品的尴尬局面,提升了用户的使用体验。
[0063]以下结合图3和图4对本发明的技术方案作进一步说明。[00]常见的语音识别错误分类如下:[0065]A、简单的语音字面识别错误,语音的一个拼音对应多个汉字,比如“乐百氏”识别为“乐拜师”,“三五麻辣鱼”识别为“35麻了雨”等情况;[0066]B、多音字的发音问题,比如“花之语杭白菊”中的“hang”还是xing;[0067]C、部分易混淆发音的错误,比如n和l、h和f、zh、ch、sh和z、c、s等;[0068]D、方言中的错误,比如江南、广东一带口音,比如商品“红盈袋袋泡小黄姜芽2000g”中的“黄姜牙”识别为“王江亚”或“酱板鸭”等情况;[0069]E、整体声母发音正确,但是韵母错误。比如商品“三五麻辣鱼”,用户发音“麻辣鱼”,语音识别为“马来语”;[0070]F、韵母发音正确,但是声母不对,比如“木姜子油”中的“木姜”识别为“怒江”;[0071]G、语音部分字面正确,但识别音差别大,比如“花之语杭白菊”和“话剧行白居”。[0072]针对上述常见的语音错误,如图3所示,在本实施例中,即便通过语音识别出的文字与实际商品差别较大,也能搜索出对应商品,用户通过调用第三方语音识别软件将语音流传入到ERP移动应用服务器,ERP移动应用服务器接收到语音流后将其转化文字,并通过商品识别服务器的纠错接口进行语音纠错,返回真正识别后的商品供ERP移动应用服务端进行存货商品搜索,最终由ERP移动应用服务端返回给用户进行商品录入。[0073]其中,接收参数为ERP移动应用服务器的账号id和企业纠错接口方式为rest方式,id以及语音识别后的文字,在经过进行纠错返回给ERP移动应用服务器。例如,ERP移动应用服务器传入某企业某账号的语音识别文字为“话剧行白居”,可以将其纠正为正确的商品“花之语杭白菊”传入到ERP移动应用服务器。[0074]如图4所示,语音纠错与识别的主要过程是接收用户的语音识别结果进行商品纠错,返回纠正的商品给ERP移动应用服务器进行搜索,整个系统分为数据同步与备份系统和商品识别四级系统,其中:
[0075]1.数据同步与备份系统
[0076]数据的同步与备份的过程具体为:ERP移动应用服务器通过系统的rest数据接口实现商品数据的同步,该接口通过MQ(Message Queue,消息队列)的方式异步将企业商品数据传输到后端,后端在接收到数据后,一方面需要做异地和本地备份(以作为索引文件),以在内存数据系统崩溃后,对企业商品进行恢复或重建;另一方面,对商品信息进行各种拼音注音(包括全拼、简拼、混淆音、韵母)和文本、全拼、简拼的一元、二元、三元分词后,以企业id和账号id为主键插入到对应的企业商品库中。例如对于商品“春蓉鸡精”,注音和分词模块需要完成标注:[0077]全拼为“chunrongjijing”;[0078]全拼一元为[“chun”“,rong”“,ji”“,jing”];[0079]全拼二元为[“chunrong”“,rongji”“,jijing”];[0080]全拼三元[“chunrongji”“,rongjijing”];
11
CN 105574173 A[0081]
说 明 书
9/10页
字面完整为“春蓉鸡精”;
[0082]字面一元[“春”,“蓉”,“鸡”,“精”];[0083]字面二元[“春蓉”“,蓉鸡”,“鸡精”];[0084]字面三元[“春蓉鸡”“,蓉鸡精”]。[0085]此外,商品的简拼(chrjj)、韵母(unongii)也存在一元、二元、三元的分词。[0086]2.商品识别四级系统
[0087]商品识别由四级系统构成,这四级系统的顺序是由确定性高到确定性不高,优先由确定性最高的子系统进行识别,如果识别出结果即可输出,如果高级别子系统无法识别,则进入下一级子系统进行难度越来越高的识别过程。具体地,商品识别的四级系统构成如下:
[0088]2.1第一级系统:企业商品Trie(字典)树匹配识别系统。
[00]本级别系统的目的是识别出带有常见语音识别纠错的完整商品信息识别。使用Trie树是因为匹配查找非常快,这一层建立了关于商品字面、全拼、简拼的Trie树,根据用户的输入,获取用户所在的企业和账号id,构建企业商品Trie树,并在企业中进行完全匹配(支持字面完全匹配,全拼完全匹配,简拼完全匹配)。[0090]2.2第二级系统:通用商品Trie树识别系统。
[0091]本级别系统主要解决由于可能存在短暂时期数据不同步的时间,或者用户输入当前企业数据库里没有的商品。本级别系统的识别精度也比较高,此部分功能和第一级别系统的匹配条件相同,区别在于所依据的数据来源不同,本级别系统通过查询通用商品库。[0092]2.3第三级系统:企业商品模糊匹配系统。
[0093]本级别的系统主要解决识别结果差异比较大的情况,常见的语音错误前面系统无法解决的情况。识别的基本方法是采用n-gram的技术,主要是综合字面、全拼、简拼,主要是指综合字面、全拼、简拼,对用户输入和企业候选商品进行全方位匹配,综合选出得分最高的一个商品作为输出。[0094]为了说明字面、全拼、简拼的n-gram匹配,举例如下:[0095]例如,第一个例子:用户输入“买了乐百氏X5型号牛奶5箱”,企业商品信息包含“乐
“乐百氏牛奶”的得分=3/4=0.75。百氏牛奶”,采用2-GRAM方式进行计算:
[0096]第二个例子:用户输入“话剧行白居”,其全拼、简拼为hua ju hang bai ju和hjhbj,而企业中含有商品“花之语杭白菊”,其全拼、简拼为hua zhi yu hang bai ju和hzyhbj,按照匹配,那么其匹配得分为:[0097]字面2-gram-Score(“花之语杭白菊”)=0;[0098]全拼字整体2-gram-Score(“花之语杭白菊”)=2/4=0.5;[0099]全拼字符2-gram-Score(“花之语杭白菊”)=10/12=0.83;[0100]简拼2-gram-Score(“花之语杭白菊”)=2/4=0.5;[0101]第三个例子:引入韵母的匹配作用主要解决那些发音声母相同但是韵母类似的字面匹配,比如“木姜子油”中的“木姜”识别为“怒江”,在识别过程中会将“怒江”纠正为“木姜”。
[0102]第四个例子:引入简拼的二元匹配,比如商品“三五麻辣鱼”,用户发音“麻辣鱼”,语音识别为“马来语”,这种情况下简拼的一元、二元、三元分词对于“马来语”识别为“麻辣
12
CN 105574173 A
说 明 书
10/10页
鱼”的转向起了正向的作用。[0103]其中,对于全拼的匹配,可以字的全拼作为整体去匹配,非字符;也可以按照字符级别的n-gram进行匹配,简拼也可以采取类似方式,最后每个匹配得到的商品得分加权得出:字面匹配权重最高,全拼次之,简拼权重最低,将得分大于预设阈值的商品作为目标商品输出,若得分低于预设阈值,则说明通过本级别系统认为没有识别出。[0104]2.4第四级系统:品牌品类投票及企业商品搭配识别系统
[0105]本级别系统主要目的是根据用户的输入和候选的品牌和品类的列表的模糊相似度进行投票,得到相似的品牌和品类的列表,组合品牌和品类的商品搭配,依据通用商品品牌和品牌的统计信息,按照搭配频次的高低进行商品排序,综合选出最佳匹配的相似商品集合。具体地,首先分别找出候选的品牌和品类集合,然后根据这些候选品牌和品类给企业所属商品进行投票打分,比如企业有商品“乐百氏牛奶”,候选品牌里面如果有“乐百氏”,品类列表中也有“牛奶”,则这个商品条目获得两张投票。[0106]下面举例来说明这四级系统的识别效果:[0107]1)、假设企业存货中含有“乐百氏牛奶”,语音识别结果为“乐拜师牛奶”等字面错误但全拼结果正确的,第一级企业商品Trie树能直接识别,主要是全拼Trie树的识别。[0108]2)、假设企业商品存货不包含,但是通用商品包含,如果出现第一级别简单错误,那么在第二级通用商品Trie树能够识别。[0109]3)、假设企业商品中包含,但是识别结果比较离谱,将进入第三级系统。比如商品名称为“花之语杭白菊”,但语音文本为“话剧行白居”,虽然语音文本与实际的商品差别很大,但是其一元全拼花hua,二元全拼白菊baiju对于实际的商品发音也有一些模糊相似,另外,第三级系统还结合着三元(连续三个字)的全拼和字面也给出模糊得分以及商品的简拼和商品韵母匹配得分,最终在给定预设阈值中识别出实际的商品。[0110]4)、假设语音文本和实际商品的匹配程度第三级没有给出商品,说明语音文本和实际商品的模糊匹配程度低于预设阈值,那么启用第四级系统,根据语音文本按照模糊相似性的方法在品牌词库中识别出品牌列表,在品类词库中识别出品类的列表,最终根据品牌和品类的搭配情况识别出最终的商品,比如实际商品为“脉动青柠运动饮料”,语音文本为“买多起立云朵银鹭”,跟语音输入相关的品牌可能含有麦多、脉动、银鹭,相似品类列表含有耳朵、饮料、火锅等,而品牌品类的组合中,根据通用商品的搭配信息,计算出搭配得分(品牌和拼配的互信息得分),选出脉动饮料为最佳的商品作为此次商品识别的结果。[0111]以上结合附图详细说明了本发明的技术方案,提出了一种新的基于语音识别的商品搜索方案,在用户通过语音搜索商品的过程中,通过不同优先级别的查找模式来逐步搜索查找目标商品,大大增加查找到目标商品的概率,使得即便识别到的字符信息和目标商品差异较大时,也能确保搜索到对应商品,提升了用户的使用体验。[0112]以上所述仅为本发明的优选实施例而已,并不用于本发明,对于本领域的技
凡在本发明的精神和原则之内,所作的任何修术人员来说,本发明可以有各种更改和变化。
改、等同替换、改进等,均应包含在本发明的保护范围之内。
13
CN 105574173 A
说 明 书 附 图
1/2页
图1
图2
14
CN 105574173 A
说 明 书 附 图
2/2页
图3
图4
15
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- 99spj.com 版权所有 湘ICP备2022005869号-5
违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务