- 近期网站停站换新具体说明
- 按以上说明时间,延期一周至网站时间26-27左右。具体实施前两天会在此提前通知具体实施时间
主题:回覆本嘉明兄:對台灣現況與民情的分析 -- aiguille
这轮博弈到术的层面就是养蛊。怎么说法,好比神创有没有泡沫,新新三板有没有泡沫,肯定有而且大多数企业有。但是一个领域起来一家有竞争力的企业就够了。曾经提过某鹅股东的事,他就说过投过的企业有近千起来就两家一家是某鹅一家叫华为。现在各种技术创新领域也一样。或者说百分之99的炮灰托起一家最毒企业。这家企业撑起整个产业琏。美帝的第一名通吃的博弈选择与此算殊途同归。作为企业,重要的只是活下来。
名人如霍金和Elon Musk都对人工智能(AI)的危险性公开发出了警告,但人工智能领域的专家呢?
加州伯克利的计算机科学教授Stuart Russell说,许多人可能认为AI在几百年内不会对人类构成风险,这些人可能需要回顾一下历史:卢瑟福信心十足的断言原子能永远也无法被利用,与西拉德的中子诱导核链式反应发明相隔不到24小时。
Russell不是唯一一名担心AI的AI研究人员。根据2014年对170名业内顶尖专家的调查,18%的人相信,如果机器超级智能出现,它将对人类产生存在性灾难。13%的人认为先进的AI会对人类构成净负面影响,略超半数的人相信是净正面影响。绝大多数人相信与人类相当或高于人类的AI是不可避免的,认为到2050年有50%的可能性会出现与人类相当的AI,到2075年这一可能性会达到90%。大部分专家相信,在每一方面都超过人类的超级智能会在30年后到来。
电信行业,在华为出现之前就可以知道必然会有企业成功,因为国外已经验证了行业的生命力。石墨烯就未必了,它的行业是否成功不是必然的,很可能有几家小厂家靠着偶然成功的小应用能养活自己,但不会形成巨头。实际上,对于石墨烯的发展而言,与其说电信业的华为有借鉴意义,不如说与石墨烯类似的C60和CNT更有借鉴的价值。后两者经过二三十年的发展,至今只是在很小的领域里略有应用,每年的市场不过几亿软妹币而已。
不过话说回来,葡萄的期待也不一定会落空。相比于C60和CNT等,石墨烯还是更有潜力的。万一哪天谁金手指了,搞成几个意义重大的应用,也未为可知。此外,石墨烯还有一件功德应该被人铭记:作为史上吹得最大的科研泡沫之一,它几乎把所有的科研领域都圈进来了,导致做石墨烯研究的人往往具备跨领域、多学科交叉的视野和素养,这些人里很可能产生未来的科技领军人物。所以说石墨烯在科研人才培养方面,是的的确确产生了效果的。
千分之二的成功率。我看几年后众多被今相忽悠进股市的小民都要血本无归了。
阿里也不会免俗。
全部超越人类就等于人类是多余的,没有人类它一样可以进化发展?
这是无法想象的
计算机所计算出来的东西跟现实世界是不一样的,比如说计算一个具有实际意义的pde,其实计算机不能直接处理任何pde,是人从现实世界猜测出了解可能具有的形式,然后用摄动法转化为计算机可以处理的多维数组(有时是符号代数)的形式然后让计算机去输出
得到的数值解与现实多接近或者说在多大的范畴下是有利用的价值?这是无法先验得知的,绝大多数人情况下得去实际干一把才知道,因为人有主观能动性,可以主动的去解决测试问题,计算机又怎么去主动得作一件事呢?
这个过程,完全脱离人是不可想象的,不是今天的任何理论可以达到的,实在的说人是没法跟计算机比的,人工智能是很有用的工具,但它取代不了人的地位
我觉得一种比较可能的悲观的发展是,整个社会疯狂的迷信所谓ai然而,ai又不能真正取代专家最后导致相关的技术流失以致与整个社会在技术流逝与脱离现实的浪潮里被肢解决,正如历史上绝大多数的衰退而灭亡的文明那样
而乐观的的路线呢,就是ai真正变成了有用的工具,解放了人的劳动,使得我们能够把精力施展在更有创造力的工作之上,事实上就尽几十年非线性科学进步的趋势来看,若要对世界得到进一步认识改造现实世界的力量,需要一百年前多的多的人力智力投入,因为我们面对的是一个丰富的远远超出二十世纪初所想象的极限更加复杂的世界
在这个复杂的世界里没有十九世纪想象的那样的普遍理论,只有更加实际而特殊化的技术,这些东西的掌握离不开人,所以我觉得在今天讨论计算机超过人这个论题实际没有好处的
这种机器取代人的想法本质上就是古代神秘主义的那套玩意,贬低人的价值最后只能衰退啊
兄弟不才,虽是小民一个,但是也接触过大数据,目前做的也是提供基础架构的工作。偶尔也能见到一两个牛人,七弯八绕的也有幸聆听过院士和某些政府高官的半公开会议。听来听去,他们提到最多的还是要解决数据共享和数字化的问题,特指魔都。另外就某些数据采集工作来看,还是老一套要求一线的事业单位/行业协会提供数据,他们的数据又是问企业要的,那还不是上面想看啥就有啥么?可能有些央企自建系统,但是在大面积的社会数据都是手工采集,尤其是小微企业这块。说个笑话税务系统是联网的吧,在企业评审过程中,连税务数据都要企业自己提供,无法从税务系统之间给出统一查询接口。我只能说如果数据被算作固定资产,某些部门会非常快的做大,并拥有比以前更大的行政权力,是逆行政改革潮流的。简单说,不是很严谨拉,你要查询数据,他一句话就把你顶回去了,白查就是国有固定资产流失,要想查就要明码收费,具体怎么收费还不是他一家说了算,例如:税务,电力,人口这些数据都是一家独大的垄断滴。最后绕一圈,还是要靠行政力量解决这个问题,大数据市场化交易行为,我觉得只能限制在一些商用数据上还是民对民,例如:某个区域的人比较喜欢某类食品及其价位等等。
大数据、趋势与黑天鹅
大数据的核心是关联算法,抓主流,分析趋势,一般取95%的置信度,
问题是,真正有价值的恰恰是哪些5%,我们在实际分析时发现:黑天鹅才是新常态
金融市场 大家都是大数据 会反向干扰态势的
现在(2015) 黑天鹅才是新常态
看看:石油价格 瑞士法郎 日元升值 光大砸盘黄金狂跌
全部没节操 没下限
参见《大数据与黑天鹅等》
07年我就开始做舆情,而且采用的是智能语义分析模式,应该是国内最早的,
基本是原创代码,后来检索资料,发现政府招标,并且有总参参与,就主动放弃了
也接触一些机构,包括广东省宣传部相关人员和深圳专业的舆情分析公司(类似香港的第三方民间评估机构)
因为这块太敏感,而且个人不喜欢与政府机构合作,政府部门往往多破坏,少建设
后信息时代,创意经济,个人的主动性非常重要,甚至是第一位的,
这个才是欧美目前真正的核心竞争力,国内政府必须认真解决这块,才能提升全体国民、企业的竞争力
参见《当代TG人的“异化”》链接出处
黑天鹅才是新常态
真正做大数据分析,和看报告是不同的,做研究,尽量使用第一手的资料和数据,转手越多,数据污染越严重。
目前大数据用的比较成熟的有三块:互联网广告分析、机器翻译、量化投资
因为项目需要,早期我做过原创的ocr代码,这个图像分析、模式匹配、人工智能是基本功
早在99年,就开始用语句库、统计模式做英语翻译软件,比谷歌还早几年,素材是电影的双语字幕,当时就有百万级的语料库,国内同期的北师大等项目,不过几十万,
后来因为资源和课题发现,没做这块,附带出版了一套《魔鬼英语》教材,
对于普通人而言,想把握目前大数据、人工智能的发展程度,看看百度、谷歌的中英翻译网页就可以,随便找段英文,机器翻译下,
这个翻译水平,降低一个数量级,差不多就是当前大数据、人工智能的实际水平
这几年,做量化投资方面的数据分析,越做越发现:黑天鹅才是新常态
为什么混沌理论,是量化投资的基础理论?
因为市场是双向的,任何机构、个人,通过数据分析,进行决策,参与市场
对市场是会有干扰的,人少还好办,人一多,整个市场就乱套了
在所有的股票数据中,早期,macd是比较科学的,也是非常有效的
当大家都用macd指标,作为投资参考,
完蛋了,不是一只蝴蝶,而是所有人都成为了蝴蝶
整个市场数据,完全被污染,macd也成为无效指标
所以说:人人都大数据,就人人都没数据
现在的投行标配,全部是交易员自己写代码,将策略直接程序化,
尽管如此,即使100%保密,因为每家头行都以亿美元为起点,对市场影响也是超级“蝴蝶效应”,造成很多策略都是一次性的
大数据与死数据
据说,汶川地震,药物管理问题,刺激了政府大数据战略,这个实际上,是有很大问题的
首先,这个模式类似macd指标,有效性,是建立在数据库封闭基础上的,只有政府和少数关联企业可以使用,普通企业、个人,没有权限使用这个数据库的,
如果大家都能使用这个数据库,百度一下,分析汶川缺少板蓝根,大小老板、甚至个人投资者,全体板蓝根,几天后,汶川会成为全国、甚至地球上板蓝根密度最高的地区,
这个“姜你军”要涨价,“蒜你狠”不折腾,已经有过案例,
资本的力量是无法阻挡的,即使政府限制,关系企业,有关人士,也会拿到相关权限,这个毕竟只是商业数据,保密权限不可能很高,“SSS”级,和二炮一个级别
淘宝余额宝,也是一个类似的案例,早期,阿里数据源不开放、其他基金嫌麻烦,再加上互联网企业贴本吆喝、花钱买客户的传统,表面收益貌似蛮高。
等行业稳定下来,目前余额宝的收益,也和行业其他基金差不多,
这种趋势,不过是价格二元化,在大数据行业的复制,与政府改革开放的出发点是相悖的
互联网的基础是:open(开放)+free(免费),基于互联网的大数据产业,如果违背这个基础,只能是空中楼阁
这种管制模式的大数据产业,越发展,对整体经济损伤越大。
首先,少数权贵部门和企业,从资本、原料等方面的垄断,会延伸到数据方面的垄断,获得不当利益,
而广大普通企业、个人,却因为受限于数据,无法进行正确的商业决策、个人投资,社会的二元化分割更加严重,
这个,看看现在的房屋数据库,始终无法进行全民查询
这里多说一句,政府与其,梦想通过大数据,建立2.0版本的1984社会,不如管好全国四百个城市的局级以上官员,毕竟这个才几十万数量级
如果连几十万数量级的中高官员,而且绝大部分是党员,都无法有效管理,希望利用大数据,来管理十亿级的民众,只能是。。。。。。
其次,数据与资本、原料、设备不同,一个邮件,一张U盘,就可以将涉及全体国民的数据暴露给国外敌对机构
发达国家的模式是,除极少数敏感数据库外,普通数据基本免费开放,全民共享,这样才能全体国民受益,减少数据事故,减少数据意外事故,对普通企业、个人的冲击
更多参见《大数据与死数据》
大数据与数据干扰
政府大数据项目的一个“G点”,是舆情监控
通过QQ纪录、微信关键词的确,可以进行一定程度的舆情监控,公共事件管理
但是,真正的破坏者,例如敌方,恐怖分子,异议者,可以用很低的成本干扰数据源
《机器之心》里面,杀手采用口红大小喷剂,就可以屏蔽摄像头的人脸拍摄
《大数据与史上最强网络推广个案:hp笔记本》链接出处
也提到,如何通过软件,提升关键词比重10%-50%,这个很多seo教材都有
关键是,这个成本很低,稍微在网络下载一些hack教材,只需要一台笔记本,就可以控制成千上万台肉鸡,进行干扰信息发布
hack违法,没关系,买套群发软件,买几台二手电脑(五百元的主机级ok),一根网线,几千元,就可以搭建全部硬件
验证码,没关系,云打码,完全人工识别,准确率99%
IP限制,没关系,vpn每个月十块钱,上千个IP地址,全世界都有
......
这个了解一点情况,据报道国家预警信息中心是中国气象局牵头的,这个应该起源于气象预警信息的公众发布,最常见于电视和手机,后来想扩大到其他领域,包括一些社会突发事件的发布,但是这个“想”目前仅限于气象部门,至于其他公安、城管、水务等相关部门包括地方政府想不想那就不知道了,至少目前看来还是气象部门在自己吆喝,气象部门在地方政府有多弱势就不用说了,难度比较大。这里涉及一个信息共享的问题,信息就是资源,就是权力,不同的信息其背后蕴含的资源不一样,共享信息即使可以获利,可获利如果不能和资源相匹配,谁也不会干,政府部门之间尚且如此困难,不同性质不同法人的企业之间怎么共享数据,如何解决利益分配,现在看不到办法,牵扯的方面越多越难平衡。
基于大数据的量化投资、股市系统,验收标准,
摘自QQ对话
注意下盈利参数V,其他都是技术细节
目前大盘整体波动大,要和大盘平均指数比,不然没有意义
另外,注意稳定性,取2-3个月的周平均指数,看看系统模型有没有bug
被删了吗,我也想看下,这个思路很不错
用大数据分析股市的模式识别
能在发下吗
对机器人熟不熟。上周因为国家实验室公众开放日接触一个机器人项目。有兴趣近一步接洽,你的技术这领域有应用么。