五千年(敝帚自珍)

主题:如今胡萝卜都不可靠了,要反复测试 -- 类反词典

共:💬37 🌺10
分页树展主题 · 全看首页 上页
/ 3
下页 末页
                        • 家园 那个似乎目的不同

                          是用来对付封IP和流量检测的。看Youtube和下大文件(一般都是拿诸如rar压缩过的)当然没办法拿关键词去套。我觉得这不说明什么。

                          英文Wiki关于GFW中写到GFW其中一种检查方法就是对内容的过滤:

                          Packet filtering

                          Terminate TCP packet transmissions when a certain number of controversial keywords are detected. This affects all TCP protocols such as HTTP, FTP or POP, but Search engine pages are more likely to be censored. Typical circumvention methods are to use encrypted protocols such as VPN and SSL, to escape the HTML content, or reducing the TCP/IP stack's MTU, thus reducing the amount of text contained in a given packet.

                          当然这种机制是否总是启动还是在什么条件下启动,都是值得研究的。

                          • 家园 不是对付封ip和流量的

                            如果是封ip,这两个计划是都没有办法的,必须借助tor之类代理上这些站点。

                            GFW也不会对流量进行检测的。

                      • 家园 解压gzip分析内容对GFW是不可承受之重

                        GFW之所以是基于入侵检测系统模式而不是防火墙模式,就是因为无法承受大运算量

                        • 家园 问题是网上http通讯有很大量都是基于gzip的

                          如果连这也搞不定,GFW怎么运行?我测过几个国内论坛,我如果在http头上Accept-Encoding里有gzip,过来的都是gzip流,而这是比如说Firefox的缺省配置。

                          • 家园 不要说gzip了,GFW连未压缩的内容都不是都检查的

                            GFW大部分时间是看url,它大部分时候是没有时间查看经过的文本内容。

                            GFW之所以做成一个入侵检测系统,而不是一个大防火墙模式,就是因为运算能力不足以响应。

                            • 家园 根据我看天涯社区的经验,GFW是看内容的

                              我看的国内论坛绝大部分都没有什么会被GFW的东西,所以不大会碰到GFW给我发送RST。但是天涯社区里的帖子敏感词不少,我这个在国外的要看,有时就会被RST。天涯社区的帖子每页都很长,于是这个被RST的症状往往就是网页内容显示了很多,突然间就变成了“连接被重置”的页面。所以这就说明:GFW的确是双向的,它不但检查和重置国外传向国内的内容,也检查和重置国内传向国外的内容;其次,GFW是浏览网页内容的。

                              • 家园 我没说都不看啊,我是说它是根据某些重点url来确定策略的

                                所以这些重点url应该启用gzip来拖GFW的运算能力。

                                GFW是双向的,那是因为他先发现了你的发起的目的地,所以才检查。你看看《西厢计划第二季》就知道了。

                                《西厢计划第二季》能突破GFW的 IP封锁 和 URL关键词过滤 。它的实现原理是利用GFW的单向IP封锁特性,将 发出 的数据包通过国外的第三方服务器中转,而收到的数据包 穿过GFW直接到达客户端 。当用HTTP方式观看在线视频或下载大文件时,对中转服务器仅耗费极小的流量 。同时,由于GFW只能捕捉到单向的流量,无法建立TCP状态机,关键词过滤也就失效了。

                                • 家园 可我发起的目的地并不是什么重要的地方啊

                                  就是我私人的IP而已。而我要访问的地址,则是国内的一个网站。这样的一种关系,无论如何也不应该是GFW愿意花大力气(如果你的gzip要消耗大量资源的观点是对的话)不仅检查URL,还检查内容的重点目标啊。

                                  你引用的这段是说“单向IP封锁”,似乎和前面我说的事情不一样。

                                  依我看来,gzip的运算量并不是GFW所最担心的,如果一般芯片不行,TG还会开发或购买专用芯片。

                                  如果是服务器和客户端说好要一起对付GFW的话,其实最方便的就是使用简单的加密钥或者再hash一下:把大量内容用一个由服务器随机生成的密钥加密,这个加密方法可以非常简单,比如就拿这个密钥和内容滚动地XOR一下,然后在最后附上这个密钥。

                                  客户端没有任何问题,因为最后能得到密钥然后解密,计算量只有一点点。但是GFW就不好办了,它在一开始解不了密,因为没有密钥,靠猜就计算量太大。最后它也能拿到密钥,但是它得记住所有以前的内容才能去解密。于是GFW加强计算力是不够的,必须加强记忆量,这是远为困难的事情。

                                  • 家园 你说的这个解决方法其实早就有了,就是https

                                    这GFW肯定是无法解开的,所以只有停掉ssl的端口的链接。

                                    你看,国内https的google doc就无法访问,但是http的google doc就还可以登录。

                                    其实现在google就有一个https的demo,就不会被GFW过滤掉,我前面里列出来过。

                                    • 家园 HTTPS太严肃

                                      https的资源消耗太大,密钥交换,证书什么的也太严肃,目的是不让任何第三者能知道通讯内容。

                                      我的方法做不到这点,真想知道通讯说的什么是完全没有问题的,只是要一个好记忆力。但是优点是那些复杂的加密解密算法,握手协议,证书之类的麻烦都没有了。比如说象西西河,如果不想因为网页上有敏感词而引起GFW的注意,就可以很简单地拿Javascript实现这个功能。当然如果GFW已经盯上了你,那就不能用这个办法了。

                    • 家园 有点意思……不过我不是很乐观,有关部门花钱还是很在行的。

                      不知道 GFW 的并行能力有多少,我想还是会很可观的。

                  • 家园 我可是在主贴什么结论都没下

                    我已经在帖子里面说了嘛,现在还不能做任何结论。

                    • 家园 不要激动嘛, GFW 是一个很有趣的黑箱,怎么样去分析

                      是件很有趣的事情。这么有趣的事情,没必要把自己的感情掺进去。

                      构造 url 去分析是相对简单的一个方法也比较容易被人们理解。所以讨论 GFW 的文章一般都会提到。

                      话说回来,你要试过我给你的 url 应该明确给我一个结果啊

                      • 家园 我试的比你还多

                        而且我还试了页面内容和URL的各种组合。咱也是曾经啃过RFC的人,在这里面双方能做什么勾当自然是很清楚的。要如何用技术手段来区分谁在做坏事,还是可以做不少工作的。当然某些细节因为资源的限制无法测试。

                        我承认我很无聊,是真的无聊

                        因为这个问题其实根本就不应当成为问题。本来我从来不怀疑这个是gfw干的,如果不进行这一系列的试验,那google的形象可以说是非常的cj。但是经过这一系列试验,我只能说,可以证明gfw干了坏事,但却不能证明google是干净的。

                        有这么个结果,有这么多讨论,某类人应该反省一下了。他们的工作做得实在太差了,起的完全是反效果。

                        • 家园 空口说白话,建议你把你的论证结果发到it论坛去

                          如果你很精通RFC,建议你也能为翻墙作出贡献。

分页树展主题 · 全看首页 上页
/ 3
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河