2024年3月9日消息,据国家知识产权局公告,中国电信(601728)股份有限公司申请一项名为“分词方法、装置、非易失性存储介质及电子设备“,公开号CN117669560A,申请日期为2023年11月。
专利摘要显示,本发明公开了一种分词方法、装置、非易失性存储介质及电子设备。其中,该方法包括:获取文本语料的语料分词表,其中,语料分词表中包括:多个语料分词;分别对语料分词表中的每个语料分词进行分词,得到每个语料分词对应的子分词表,其中,子分词表包括:多个子分词;确定每个子分词的词性;依据词性在语料分词表中过滤掉不符合预设规则的语料分词,其中,预设规则包括:在子分词表中子分词的词性不符合预设条件的情况下,确定子分词表对应的语料分词不符合预设规则。本发明解决了现有技术分词不准确的技术问题。