核心技术
Core Technology
PFG在中文语义识别方面,自建了大规模的语料库,通过对语料库的新词发现,结合行业词汇,整合成专业词汇,网络词汇丰富的本体,还加入了大量的汽车行业,网络等的特定规则,十分适用于汽车行业的中文语义分析。 PFG每周都采集数以万计的网页语料,不断扩大本体的规模,使之更贴近实际应用场景。在模型方面,PFG采用了半监督学习的CRF模型,对语料进行训练,获得汽车行业的语义分析模型。此外,PFG还改进了分词器,研发出新词发现技术,并构建了基于汽车行业的情感分析技术,自动识别消费者对汽车的评论对象和评论情感倾向,并能够自动对热点讨论话题实现聚类。 |