主题:【原创】云里雾里的云计算 [1] -- 邓侃
共:💬620 🌺1262
复 不敢班门弄斧
目前确实是个难题,到底有没有解现在都说不清楚,分词的流派也是过江之鲫,正着反着靠词库不靠字库自学习的都有,但是不管“XX更懂中文”,下面这个经典的句子估计都够这些算法喝一壶的
乒乓球拍卖完了
怎么分?
乒乓球/拍卖/完了
乒乓/球拍/卖完了
都对?
羽羊在做自己公司网站的时候费了牛劲折腾中文分词,后来还是放弃了,功力差太远,找了开源的方案了事。
前段时间和一个哥们醉酒扯淡,聊到google和微软之争,此君语出惊人:微软的武器库多着呢,只不过还没找着用处,不信看看微软拼音和谷歌拼音,半吊子整句输入和近似完美的词库,高下立盼,google的卵蛋捏在别人手里呢。
此话一出,羽羊醒酒大半,此君人事不省。。。
- 相关回复 上下关系8
压缩 5 层
🙂不敢班门弄斧 6 hansens 字1020 2009-02-05 19:24:42
🙂或者做企业级的用户终极搜索体验? 1 meokey 字513 2009-02-08 22:33:41
🙂几个方向,包括自然语言理解技术,结构化知识发现等也许 1 hansens 字1421 2009-02-09 00:05:46
🙂关于中文的检索
🙂老弟不要谦虚。 2 素里太守 字213 2009-02-06 02:21:44
🙂说得好极了 1 邓侃 字120 2009-02-06 03:58:20
🙂刚碰撞点火花出来,还没有细想,容我梳理下 1 hansens 字0 2009-02-06 06:25:27
🙂详细说说 1 邓侃 字338 2009-02-05 19:35:42