蘭州網(wǎng)站建設-蘭州網(wǎng)站優(yōu)化-優(yōu)化網(wǎng)站標題設置如何利用百度索引擎中文分詞技
閱讀 ?·? 發(fā)布日期 2019-01-02 20:16 ?·? admin蘭州網(wǎng)站建設-蘭州網(wǎng)站優(yōu)化-優(yōu)化網(wǎng)站標題設置如何利用百度索引擎中文分詞技術,網(wǎng)站建設,網(wǎng)站優(yōu)化排名,網(wǎng)站標題設置如何利用百度索引擎中文分詞技術。搜索引擎中文分詞技術簡單來說,就是把中文的漢字序列切分成有意義的詞組。
分詞例子:我/是/一個/學生
搜索引擎分詞技術簡述
1.基于字符串匹配的分詞方法
按照一定的策略將待分析的漢字串與一個極其詞庫中的詞條進行匹配。
常用分詞的方法:
正向最大匹配法(由左到右的方向)
分詞測試例子:我/有意/見/分歧
反向最大匹配法(由右到左的方向)
分詞測試例子:我/有/意見/分歧
據(jù)大量測試數(shù)據(jù)統(tǒng)計結果表明:單純使用正向最大匹配的錯誤率為1/169,單純使用反
向最大匹配的錯誤率為1/245。逆向匹配的切分精度略高于正向匹配。
2.基于統(tǒng)計的分詞方法
相鄰的字同時出現(xiàn)的次數(shù)越多,就越有可能構成一個詞。用于系統(tǒng)自動識別新詞。
3.基于理解的分詞方法
在分詞的同時進行句法、語義分析,利用句法信息和語義信息來處理歧異現(xiàn)象。
分詞技術歸納:少于等于3個中文字不切割,對于大于等于4個漢字的詞將被分詞,分詞結論:百度識別人名、影視、戲劇名等專用詞,轉用詞庫分詞時優(yōu)先。
為您推薦
- 襯塑管網(wǎng)站建設_網(wǎng)頁定制制作與開發(fā) 2020-01-12
- 保溫管網(wǎng)站建設_網(wǎng)頁定制制作與開發(fā) 2020-01-12
- 玻璃管網(wǎng)站建設_網(wǎng)頁定制制作與開發(fā) 2020-01-12
- 鍍鋅方矩管網(wǎng)站建設_網(wǎng)頁定制制作與 2020-01-12
- PVC管材網(wǎng)站建設_網(wǎng)頁定制制作與開發(fā) 2020-01-12