跳动百科

腾讯公司申请文本处理方法专利,能够提高词语归一化的处理效率和准确性

宗政玉晴
导读 金融界2024年7月9日消息,天眼查知识产权信息显示,腾讯科技(深圳)有限公司申请一项名为“文本处理方法、装置、设备、存储介质及产品”,...

金融界2024年7月9日消息,天眼查知识产权信息显示,腾讯科技(深圳)有限公司申请一项名为“文本处理方法、装置、设备、存储介质及产品”,公开号CN202410739540.5,申请日为2024年6月7日。专利摘要显示,本申请提供了一种文本处理方法、装置、设备、存储介质及产品。方法包括:响应于文本处理请求,对待处理文本进行目标类型的词语提取,得到目标成分词语;对待处理文本的全部字符进行下标标记,得到与目标成分词语对应的目标成分词下标序列;基于预设的扩展下标数量阈值,对目标成分词下标序列进行至少一次下标扩展;在每一次下标扩展得到扩展词下标序列之后,对目标成分扩展词语进行归一化处理,得到包含目标成分