五千年(敝帚自珍)

主题:【讨论】推荐一款即时沟通软件 -- 格格巫

共:💬54 🌺36
分页树展主题 · 全看首页 上页
/ 4
下页 末页
                  • 家园 关于成本问题的回答

                    加密的成本要远远比破译的成本高,这是显然的,要不然这个算法就没有使用价值了。

                    但是,一个完整的安全通信体系,远远不是加密算法这么简单。

                    例如说,加密的关键是密匙。那么:谁拥有密匙?谁保管密匙?怎么保管?如果你需要更换密匙,你用什么途径把这个新的密匙告诉你的朋友?如果有一天你接收到一个新的密匙,你怎么确认这个是你的朋友发过来,而且没有被泄露或者篡改的?

                    所以,反过来,要破解一个加密通信体系,也不仅仅是只有破译加密算法这个方法。

                    例如说,分析你们的流程体系,找出弱点;或者监控你们的密匙交换过程;或者分析或者监控某些关键特征码等等。

                    当然,对于一些高级的加密系统,最最简单,也是最最便宜的方法莫过于收买一个拥有或者掌握密匙的人。

                    回到你举的例子:

                    In [11]: hashlib.sha1(s).hexdigest()

                    Out[11]: '5ec3d4b1b0c96f4dab3e79dab25eb2e37b8a3117'

                    你的代码确实很简单,用起来很方便。但是你知道这个过程中你的sha1算法到底用了哪个密匙对吗?如果你不知道,你怎么让你的朋友去解密这个信息?如果说加密解密的密匙对被封装在这个加密库的内部,那要破译就实在是太简单了,只要找到你用的是哪个加密库,用对应的解密过程就可以了。

                    呵呵。

      • 家园 我猜测常规的中美间的国际长途也是被中美双方都监听的

        一般的电话也无所谓,当有些关键字出现的时候,会触发录音或者报警等事件。

        当然这是我的猜测。

        • 家园 技术上讲是不可能的

          其实可以简单设想一下,如果每个电话都要监听的话,那要有多大的数据处理量。一段3分钟通话,用wav文件格式存贮,就是1M,想想看每天有多少电话,每个电话都要存储处理的话,那要用多大的硬盘?

          用实时语音分析?恩,天才的想法,不过成本呢?语音处理不是大家想想的那么简单,叫你从一堆011010100101110100101100111 中找出一个人说的话,并不是那么简单,另外我可能说的不是普通话,也许是英文,也可能是方言,也可能是阿拉伯话。

          一般的电话监听处理就是主被叫,CIA或者国家安全局有了特定的目标,然后获得这个目标的所有可能通讯号码,然后就是如果这个号码有呼入或者呼出,那么程控交换机就会自动启动录音。然后再交后台进行分析。从成本上分析,除非紧急情况,每个通话后面放一个人实时监听是非常不经济的(这个监听人的语言能力要求非常高),难道需要一个人7天24小时守在监听器傍边?

          另外也需要纠正一个误解,电影中特工或者间谍,总是找一个公用电话,然后紧张的拨号,看着表,到一定时间就挂电话,然后就看到CIA或者警察在那大叫DAMN,或者一个小IT在紧张地要求尽量延长通话时间,最新的电影大概还能看到地图从全球逐步搜索到一个城市的街区,这个好莱坞的经典桥段,实际上,一旦对方电话开始振铃,甚至在电话还没有振铃的时候,这个号码以及这个公用电话所在的位置就已经知道了。看表,大概警察或者CIA需要一段时间赶到那个公用电话亭吧。(不知道电影导演是不是真的是个技术盲,还是有意迷惑犯罪分子)。

          生活中其实最简单例子,莫过于主叫号码显示了。你的手机不是能够显示对方电话号码吗?警察或者CIA的技术就这么落后!?

          • 家园 您说的电影中的场景,在程控交换机中也是最基本的功能

            这种功能叫作Call trace。

            在固网里原理最简单,根据主叫,被叫号码,被转移的号码(forwarded number),可以追踪到这路电话主叫,被叫,以及转移方,或者电话会议成员的物理端口,不过这个端口是对于程控交换机来说的,基本上就是交换模块->机架->板块->端口。在运营商处有更具体的数据,比如线路终端的详细地址,可以具体到住家或者运营商建的电话亭。

            移动电话可以追踪到基站,现在有很多基于移动终端的定位方法:手机可以同时接收到多个基站发来的无线电波,同时通过场强计算来确定信号最强最好的基站。无线定位方法之一就是通过手机终端收到的多个无线基站发来的无线电波强度等信息来计算出相对于手机相对于那几个基站的位置。

          • 家园 我想您可能没有完全看明白我的意思。

            其实可以简单设想一下,如果每个电话都要监听的话,那要有多大的数据处理量。一段3分钟通话,用wav文件格式存贮,就是1M,想想看每天有多少电话,每个电话都要存储处理的话,那要用多大的硬盘?

            我想您可能没有看明白我说的意思,我的意思是,每个电话都被中美双方监听,这个监听,不是由人来完成的,而是由机器完成,所作的就是一个关键词触发,没有出现关键词的通话是不被记录的,只有含有关键词的通话才会触发后续的处理,我想可能会被录制,然后再做后续处理。

            我不知道中美之间的具体线路情况,从一则新闻报道上推测,2008年第三季度之前的中美海底光缆为电话提供的容量大约是103万个通话的数据量,按照文中提及的国际通信90%以上的业务是由海底光缆承担的话,那么中美之间的电话容量在此之前是大约115万个通话。(如果有哪位河友有具体的数据就好了。)

            按照你文中提及的语音数据的数据量来计算,一个通路一小时的数据量是20M,一天是480M,假设115万个通路全天24小时满负荷运转,那么数据总量大约是575T的容量,我猜测能够被语音关键词触发的几率应该不高(而其应该可以制定更为科学的触发标准,针对出现的频率等),我想可能都不足千分之一,不过,我们按较差情况估算,百分之一计算,每天的全部存储数据量不到6T,按照30天存贮周期计算,总共的存储空间大约需要180T,我认为他们也不会把所有的数据都保存在硬盘上,很多可以放到磁带上备份。就算全部放到硬盘上,15T的NAS,$15,000刀应该能搞掂,12个15T的NAS就够了,算$20,000刀一个,总共也就$240,000,如果容量扩充100倍,也就是说全天24小时,每分钟都有1亿1千5百万人在进行中美之间的通话(美国人口的三分之一以上都在分分钟不停地给中国打电话),中美双方将不得不投入2400万美元购买存储设备,我想这种情况几乎是不会发生的。而且使用wav格式存贮音频文件是很浪费空间的,对于电话这种分辨率的语音信号,完全可以用压缩比更高的方式存贮数据,所以说,存储应该不是大问题。

            用实时语音分析?恩,天才的想法,不过成本呢?语音处理不是大家想想的那么简单,叫你从一堆011010100101110100101100111 中找出一个人说的话,并不是那么简单,另外我可能说的不是普通话,也许是英文,也可能是方言,也可能是阿拉伯话。

            其实我们是不需要实时语音分析的,原因很简单,我们只需要一个简易的语音识别的模块,用来触发关键词处理,语音识别的技术已经相当成熟,若干年前开始就已经广泛应用,大家的手机上不都能声控拨号么?

            一般的电话监听处理就是主被叫,CIA或者国家安全局有了特定的目标,然后获得这个目标的所有可能通讯号码,然后就是如果这个号码有呼入或者呼出,那么程控交换机就会自动启动录音。然后再交后台进行分析。从成本上分析,除非紧急情况,每个通话后面放一个人实时监听是非常不经济的(这个监听人的语言能力要求非常高),难道需要一个人7天24小时守在监听器傍边?

            您说的针对固定目标的监听我想是另外一个问题了。我所猜测的监听并不是由人来完成的。不需要115万个人坐在电话便24小时不停的监听。

            当然这些也都是我的猜测,我并不知道国家安全局和CIA或者FBI都是怎么干的。

            而且我也不是这方面的专业人士,不过是猜猜玩的,又了解行情的河友不妨说说。

            • 家园 语音识别模块并不简易

              简单的打个比方,你手机上有声控拨号,换个人用你的手机试试看用声控拨号,效果如何?再复杂一些,用另外一个方言来声控一下效果又如何?更复杂一些,用外语试试看?

              技术只是能够提高侦听的效率,有的东西实际上是做不到的,NSA所谓全球侦听的传闻,估计只是为了掩盖其背后的真正的秘密-间谍。

            • 家园 一个小问题,IP电话怎么算?

              首先,语音实时识别,尤其是在没有任何prior information的情况下的语音识别,似乎还是没有解决的问题

              其次,您那么算出来的通信量,纯粹是电话通信,似乎跟skype没关系,我不知道中美有多少人是用IP电话的,反正我周围的朋友基本上都用IP,这种情况下数据量的算法与您的算法应该是不同的,要看光缆的容量。。。

              要把这些数据包全部恢复成语音,我觉得就是一个很大的任务了

              • 家园 请您仔细看我的原文:

                我猜测常规的中美间的国际长途也是被中美双方都监听的

                我说的就是常规的国际长途,IP电话本来就不在讨论的范畴之内。

                至于语音识别的技术,上个世纪九十年代就开始商业应用了,而对简单关键字进行触发的实际应用在每个人的手机里都有,这真不是什么新技术了。

                • 家园 呵呵,用关键字

                  对一个人来说,若想传递信息,非要用某些字眼吗?

                  • 家园 其实那本来也就是我的一个猜测,

                    全无事实的依据,我的本意只是要说常规的电话也要被监听,skype被监听也不意外。

                    既然大家也都没有事实的证据,我看揣测就到此为止吧。

                • 家园 呵呵,对不住

                  楼主问的是skype,我以为包括IP电话呢,看来某些监听技术落后了不少,直接拨国际长途的,现在很少很少了吧

                  所谓商用的关键词识别,是要有先验信息的,无先验信息的语音识别,确实是问题。。。语音识别有很多种,不幸的是,随便抓个人就想识别人家语音,目前确实没有解决,即使是关键词的识别

            • 家园 关键词触发---多么好的想法啊!

              不幸的是在可预见的将来还没有实用化的希望。

              qwert01兄讲的就挺靠谱的,可惜露出一个小小的破绽害您码了这许多字。您的计算可以得出结论:也没花多少钱,负责任的大国一定会对电话内容备份的。

              是有不少语音识别的应用,但他们的识别率如何呀?想想看语音识别是一个什么档次的技术突破---它意味着机器能听懂人话,意味著真正的人工智能!!! 您也别拼音输入了,对着麦克风说就得了。

              所以常规的方法还是重点监视感兴趣的线路(电话号码),录音然后有人来听。

              • 家园 能用计算机自动把语音转换成文字也谈不上人工智能

                “真正的人工智能”应该要求更高了,不过现在大规模实用语言到文字也不太现实就是了。

分页树展主题 · 全看首页 上页
/ 4
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河