主题:【原创】园外看花说印刷 -- 河蚌
看过IBM美国团队和IBM中国团队的两篇关于沃森研发的访谈,这个沃森突破在两点:
语音识别
智能搜索的算法
IBM打算用在智慧医疗上面,不过看这个沃森的运算扩展性,部分call center的简单没有技术难度的回答也能包办,这样的话又是替代一大堆人工工作了。
1)对“危险边缘”游戏,总正确率是65%。那牛在对答案做置信度分析,选择不回答一些问题。大概有80%的问题覆盖度,对这些问题有85%的正确率。但是,有些场合要求绝大多数的问题都要给出“有用”的答案。
2)在“危险边缘”游戏中,沃森只能给出单一单词作为答案。沃森(或者DeepQA)系统能不能做更复杂的应答,公开的文献没有讲
3)对物理化学这些比较专业,概念间关系很复杂的领域,沃森的概率算法可能不太有效。
当然,沃森被公认是AI的一个革命性进步。
我一个同事,普通话比较标准,一直都是将文稿念了变成电子档,可以达到80%以上的识别率。然后再稍微编辑一下就可以,对于不太会打字的人,节省老了时间了。
CALL center我觉得以语音识别替代座席的技术好象并不太实用,因为都是用户直接按键要求人工服务的。除非是明确推出虚拟话务员服务,能够一点不错的回答问题,否则被投述的可能性很大。
倒是IVR那个,真的应该改成语音识别了,什么什么按1,什么什么按2的重复简直让人抓狂。
看过几篇比赛背景资料报道,有可能有遗漏或者偏差,欢迎大家指正:
比赛举办方对IBM沃森做了配置上的限制“
第一IBM沃森是一个几十个CPU的小集群,规模不是很大
第二IBM沃森的数据库是被限制在一个背景数据库资料里面,没有与互联网链接。
就是这样的限制,IBM沃森仍然表现出令人惊讶的学习能力,通过试错迅速矫正自己,从一个首次参赛的电脑迅速成为一个战胜人类选手的冠军,这次比赛我觉得让大家惊讶的就是这种学习的能力和适应环境的速度,要知道其他参赛的人类选手都是身经百战的成熟老手,IBM沃森成长的速度让人振奋吧
如果考虑到IBM一贯的宣传策略,这次新闻报道集中报道IBM中国研究中心的沃森的成果,这也是对IBM中国研究中心团队中的中国研究员也是一个鼓励吧
我想IBM沃森在做简单的比如航班或者时刻表这类问答时候更有优势了,这也是有人猜测IBM沃森这类设备能取代呼叫中心部分简单工作了。
这个在他们自己AI Magazine的文章里说的很清楚。
CPU的限制,并不是关键。沃森现在可以在2秒内完成大多数计算,以及比大多数人类选手快了。更多的CPU,只能加快速度,未必可以提高正确率。
没有与互联网实时互联也不是一个很重要的限制。因为沃森的检索算法需要对网页做语法和自然语言语义的分析,这些不大可能在2秒内在线完成。沃森自己保存了大概2亿页面的数据,基本够用了。
从沃森的论文里,似乎没有提到沃森有学习能力。沃森有一个机器学习模块用来评价各种评分办法的权重,但是这是在参赛前就固化的。
IBM中国研究中心参与了沃森的研究,是很重要的组成部分(特别是和结构化数据相关的模块)。不过,严格来讲,沃森的主力研究队伍还是在美国这边的IBM“沃森”研究中心。这一点,从论文的署名可以看出来。
(好像歪楼了,最好新开个话题)
张雷:沃森系统的一个关键步骤是评价备选答案的可靠性。这个可靠性是由上百个算法从各种不同的角度评价得出的。例如:关键字匹配程度、时间关系的匹配程度、地理位置匹配的程度、类型匹配程度等等。沃森在每一个角度上都能得到量化的可靠性评价。而且这些评价算法所依赖的知识源也是可追溯的。所以,如果需要,沃森可以为用户提供答案的依据。
在沃森参赛之前,它会从历史数据中进行学习。比如,如果它回答错了一个往期节目上的问题,它会从中学习到一些信息。在参赛之时,它主要依赖以前学习的结果,但也进行一些简单的在线学习。例如,它可以从已经被其它选手回答的同一类型问题中归纳出一些特点,指导其回答这类问题。另外,答错题目也会导致沃森调整其游戏策略。因此可以说,沃森具备了初步的自我学习和完善的能力。
张雷:非结构化知识主要就是以其原始的文本来表示的,而结构化知识则使用了诸如RDF这样的表示和管理方法。知识出现不一致时,沃森通过对大量往期题目的学习来发现哪些是在该游戏中更值得依赖的知识,而哪些在该游戏场景中是不可靠的。
张雷:对于人工智能实践来说,沃森的经验表明依靠单一或少数算法是很难成功的。而依靠大量的各种小算法的集成更容易取得进展。这似乎和生物界的多样性有着相似性。另外,沃森也说明,人工智能技术已经取得了相当大的进展,通过大规模的集成这些技术,很多我们看似很难的问题已经从“不可能解决”变为“可能可以解决”。例如,沃森表明,以前人工智能中的知识获取的瓶颈(knowledge acquisition bottleneck)似乎变成了一个可能可以解决的问题。
对人工智能的担忧在现阶段是没有必要的。我们还没有看到机器具有自我意识。所有的功能都是由人控制和提供的。在现阶段,人工智能技术,包括沃森,是用来帮助人的,而不是取代人的。
张雷:沃森代表的是自然语言处理和人工智能技术的突破,可以应用于很多领域,例如医疗、金融、电信、政府服务等。例如,在医疗领域,医疗记录、文本、杂志和研究资料都以自然语言编写——这是一种传统计算机难以理解的语言。一个可以立即从这些文件中找出准确答案的系统能够给医疗行业带来巨大的改变。IBM最近宣布与Nuance通信公司签署协议,在医疗行业探索、开发沃森计算系统的先进分析能力,并实现其商业化。当然,为了让沃森真正服务于这些领域,可能还需要准备相应的专业知识库等额外的努力。沃森不是万能的,对于具有很大主观性或依赖个人生活经验的问题,沃森现在是不擅长回答的。
张雷:沃森确实是一个庞大的系统。但具体来说,也就是运行在不到100台的IBM Power7服务器上。因此,它也并不是可望而不可及的。很多企业和机构已经拥有远不止100台服务器。当然,要让沃森服务越来越多数量的问答请求,需要的机器数量会上升。因此,我们也不排除通过云服务的方式来提供沃森。
张雷:IBM中国研究院在研发沃森系统的过程中,发挥了重要的作用。我们为沃森系统采集、分析和使用各种结构化的知识,利用结构化和高可靠的知识提供问题解答,排除让系统显得“愚蠢”的答案,以及帮助沃森系统提高其学习能力。来自IBM中国研究院的很多技术成果已经融入在沃森系统中,而有的研究成果则为整个科研团队提供借鉴和参考。
不久前,IBM超级计算机沃森(Watson)在美国电视智力答题节目《危险边缘(Jeopardy!)》中上演了人机大战,并最终击败两位人类冠军,赢得最后的胜利。沃森由IBM全球多个研究院和大学共同研发,历经四年研制而成。IBM中国研究院也参与了该项目的研发。InfoQ中文站有幸采访到来自IBM中国研究院直接参与了沃森项目的张雷博士。张雷博士是IBM中国研究院信息与知识管理部门研究员,在过去的三年中,他和他的研究团队与全球研究团队一起,致力于深度问答项目(DeepQA)的工作,研究并开发了沃森系统。在IBM期间他申请过多项专利并获得过IBM杰出技术成就奖。在学术领域,张雷博士研究兴趣广泛,涉及语义Web、知识表示与推理、信息抽取与检索、问题回答系统以及机器学习等,发表学术论文20余篇。他是WWW、IJCAI、ISWC等重要国际学术会议的程序委员会委员、第九届国际语义网大会(ISWC2010)的本地组织者之一,还是第一届中国语义万维网论坛(CSWS2007)的主要发起人之一。下面有请张博士为我们揭开沃森背后的技术奥秘。
http://www.infoq.com/cn/articles/ibm-watson-ai
问题是通过文本形式给Watson的。
Watson强调的是自然语言处理--文本形式的自然语言处理能力。不知道为什么无穷多人都把这个有意无意的误解成语音识别.
在我看来,繁体字到简化字再到拼音化,与其说是机械时代对汉字缺陷的认识,不如说是
机械时代,中国的精英阶层面对千年未有之大变局时,对自身器物制度文化的由浅到深的反思与应变,当中的一段急忙忙选定的一条岔路。
这不是说谁优谁劣,因为很多东西一旦选定了,就无法回头了。而我自己是相当喜欢简化字的。没有人教过我繁体字,但是小时候读第一本繁体字的读物,金庸的伊天屠龙,还是没有什么困难,也因为这样,渐渐就认识了,虽然写还是不大会,很多的繁体字。
白话文运动,拼音化运动,简化字运动,是有机而不可分的。
简要而言,就是当器物上工业化追赶(洋务运动)没用,制度上民主化(民国建立)也没用,中国的知识分子群体就不得不寻求文化上的改变。下面的话虽然是讲的普通话的由来,但是简体字不正是同样的一批人做出来的选择么,而简体字的定位,也正是汉字拼音化中的第一步:
如果说宋明之间切韵广韵的被摒弃,是因为个人生存而不得已的集体被动选择的话,那么,清末以降的官话用韵的再度被摒弃,则是因为民族生存而做出的集体主动地选择。
至于1840年以来的中国,被列强以舰炮相恫吓,勒索,使得天朝上国的优越感一夕间荡然无存。从华夏西夷,到中学为体,西学为用,再到东洋留学,再到。。。
短短五六十年,中国的精英们,无一不受到巨大的冲击,感受到深刻地震撼。而这个冲击与震撼,还一直持续到今天。
很多的人想不通,为什么,难道真的是我们不行了么?
很多的原因被提了出来,仿佛,只要我们那么做了,就会在一个晚上之后,超过那些西洋的也好,东洋的也好,的鬼子们。
凡是与列强不一样的,都被惶惶然的中国精英们认为是不好的。
观诸列强,都用的是拼音文字。。。哦,文字的发展最终方向是拼音化。。。一个结论出来了。
观诸列强,都用他们的文字记录口语。。。哦,文言文与生活脱节,要白话文,要新文化。。。又一个结论出来了。
观诸列强,都用他们的首都的口音规范口语发音,法国是巴黎音,英国是伦敦腔,日本是东京口音。。。哦,中文,也要规范口音,也应该以规范的,优美的首善之都的北京口音。。。
国语/普通话的结论就这么样的出来了。
换句话说,我不认同的是兄台所讲的机械时代汉字因为其自身缺陷而不能适应。
我认为汉字的简化拼音化只能说是前人在急急忙忙中胡乱抓的一根救命稻草,虽然没什么用,却也能给人一点心理的希望。
有些人将主张拼音化的人视为中华民族的罪人、卖国贼,并以为借口进而推出简化字的实施就是割断中华文化。我是十分讨厌简繁之争的,没有别的原因,就是因为咱老百姓都已经用熟了的东西,就没必要那么折腾了。
当然,能够让拼音化这一技术问题上升为一种文化思潮(或者说是政治化),这个必须承认,近代中国的积贫积弱、百战百败确实是关键原因。但是,千万不能用现在的眼光看待当时的思潮,在大家看不到出路时,自然会将整个体制都作为祸因。
但汉字输入书写实质上的困难肯定还是根本动因。要知道,在七十年代,TG宣传中国还是“地大物博、人口众多,勤劳勇敢善良“,那是中国老百姓自信心最强的年代(当然你可以将其归于无知者无畏),可没人说咱的国家和文化落后什么的。然而,当时拼音化仍然是大家的共识,确实是汉字难识难记难写,让人觉得太麻烦,所以才有那种论调。当时老师们就说,幸亏你们用的是简体,要是过去的繁体字就更难写难认,不过没关系,再过几年,我们就要实行拼音化了,那时候就好写了。
而拼音化方案的消声匿迹也可证明这一主因。否则你就不可能解释,为什么到了八十年代末九十年代初,拼音化的主张就听不到了。那同样是一个认为“全盘西化(或者民主自由化)才能救中国”最盛行的年代。说到底,还是技术的进步导致了这种观点的基础条件的丧失。
当然,现在人都知道,汉字实际上是汉族能够成为第一大民族的最根本因素,正是这种脱离于语音独立存在的文字,将不同语言的民族融合在一起,而且是单向不可逆的。中华文化能够延续几千年,当然有各种因素,但先祖们发明的汉字无疑是最根本的因素。
mac 和adobe早已将重点转向了web,对于cmyk的控制其实已经到顶了,从mac停止供应彩管显示屏的时候,mac和pc之间对于色彩的控制就没区别了。
真正印刷业的色彩控制牵涉面太广,从原稿到照排到制版到墨辊压力到油墨品牌,都有一整套完整的数字系统来使每一阶段的色彩曲线在最大限度接近,一般的印刷厂根本没有实力问津,边都碰不到。
所以会有日本的印刷厂能够用印刷的方式复制古代山水画,一幅卖上几十万,人家其实卖的就是技术。
更难得的是,视角还挺独到。和其他行业一样,印刷也充满了劳动的美。当然这一行业最近二三十年发展太快了。快到已经失去了曾经拥有的社会地位。几乎是在一瞬间从工艺美术变成了低附加值的普通加工业。
当然,楼主还遗漏了一点,就是在“铅与火”和“光与电”中间,还经历了一个“光与影”的阶段,也就是照相排版的阶段,那时候,大厂里都有像距长达7m甚至以上的大型照相机用以将原稿(以图像为主)复制为胶片。维基百科把这一阶段并入了“光与电”的激光照排阶段,显然是犯了一个错误。