主题:【原创】怎样设计翻译软件让计算机翻译得又快又好? -- 巨龙的脚步
曾经尝试让计算机翻译外文,结果却是一塌糊涂,翻译的结果很难看
怎么解决这个问题呢?
我认为问题不难解决,采取一些措施,就可以让计算机做翻译做得又快又好
一,根据各种不同的专业门类将各个中文外文词汇分别归入不同的类别中,或者说,把相同类别的词语并入相同的数据库当中
二,软件需要有互动功能,消费者对某些词语,短语,句子,段落等等的翻译不满意,可以要求计算机进行修改
采取了以上措施以后,要翻译就比较容易了
比方说笔者想阅读一篇经济方面的外文文献,我使用翻译软件来翻译,我首先在计算机弹出的请选择文章的专业类别---在经济类别中打一个勾
这样做有一个好处,就是计算机遇到外文的多义词的时候,会倾向于使用该专业的词义,否则翻译起来就会一塌糊涂
然后笔者对计算机的翻译文本进行初步阅读,消费者发现某些句子或词语的翻译看起来很不通顺,就用鼠标右击,计算机再弹出一个窗口
您希望计算机
1,调整单词翻译
2,调整句式顺序
选择1
计算机就在单词库当中重新选择单词,直到你满意为止
选择2,计算机则调整句子的顺序,调整成为你常用语种的表达习惯---因为不同语言的表达习惯不同,不进行类似的调整的话,文章看起来会很累
概括一下,我的思路就是:
一,将词汇根据专业的不同进行分类,划入不同数据库,以解决多义词的问题
二,通过与计算机的互动,使得翻译结果不断的逼近理想结果
google在用海量数据的形式+网民修改的方式来进行翻译优化,配合优秀的算法,几年内机器翻译说不定就能让人看懂了
除了历史的车轮,巨龙的脚步,还有哪些?
以后,这将是我的主力马甲
坦白交代,我是以前西西河里面的一个被人狂骂不已的ID---罗化生的马甲,因为我那个ID被封掉了,我只好新注册了一个马甲上来,毕竟西西河这里的氛围是不错的
向网友们求助一件事情,我前些日子接到了本论坛一位ID的短信,是看了我的博客以后,很是佩服我,想要资助我,那位ID我知道是一位与我在经济立场上很相同的一位,我非常的感动,我告诉他我处境很困难,
...未完
本帖一共被 1 帖 引用 (帖内工具实现)
水平算是国际前沿了,即使我不了解技术细节,也可以明确地告诉lz,MT问题不像你文中描述的那么简单,想要以现有的技术,达到人类翻译的程度,短期来看可能性微乎其微。
lz所说的机器学习方法(我理解是机器学习,互动什么的,大概是有监督学习),甚至只是20年前做自然语言的技术,目前的主流早就是统计学习了,并且,进展也不大,没有突破性发现的话,离实用还是比较遥远的,尤其是在跨语系的情况下。
我3年前的预言:30年内全自动的机器翻译不会达到实用性。有人不信,那么我们就拭目以待。
我给你的比较:我以前是做 OCR的,在汉王做。算是国际领先了吧?即使汉王,也仅仅是印刷体的汉字能翻译的比较准确,有实用性。手写体的识别也是一塌糊涂。那么机器翻译和OCR的难度相比如何呢?你看,一二年级小学生能做手写体的OCR,也就是能读懂一般人的手写体文稿。而大学毕业的人未必能做翻译。
翻译的难度:
1.原文是变动的,因为语言一直在变,不仅仅在于新的生词的增加,而且语法也一直在变。一篇文章,我们读过之后,大约能猜出那个年代写的。
2.输出不是唯一的。这给模式识别的自动训练造成了天大的困难。
3.输出不仅仅有对不对的说法,还有好不好的说法,对于一个复杂的句子,谁能给一个完美的翻译(信、达、雅)
4.口语就能难了,太不确定了。
我去年想到一个方法,能极大的提高机器翻译的准确度,我自己都能笑醒。可是缺乏大规模的投资支持,公司的资金也不够支持,Sigh...