五千年(敝帚自珍)

主题:如今胡萝卜都不可靠了,要反复测试 -- 类反词典

共:💬37 🌺10
全看树展主题 · 分页首页 上页
/ 3
下页 末页
家园 我可是在主贴什么结论都没下

我已经在帖子里面说了嘛,现在还不能做任何结论。

家园 不要激动嘛, GFW 是一个很有趣的黑箱,怎么样去分析

是件很有趣的事情。这么有趣的事情,没必要把自己的感情掺进去。

构造 url 去分析是相对简单的一个方法也比较容易被人们理解。所以讨论 GFW 的文章一般都会提到。

话说回来,你要试过我给你的 url 应该明确给我一个结果啊

家园 其实GFW很脆弱,主要是以前大家并没有针对他

比如假如google用post而不是get,用gzip网页返回结果,光解码运算量就够GFW喝一壶的。

家园 有点意思……不过我不是很乐观,有关部门花钱还是很在行的。

不知道 GFW 的并行能力有多少,我想还是会很可观的。

家园 是google搞砸了

Lots of users in China have been unable to search on Google.com.hk today. This blockage seems to have been triggered by a change on Google's part. In the last 24 hours "gs_rfai" started appearing in the URLs of Google searches globally as part of a search parameter, a string of characters that sends information about the query to Google so we can return the best result. Because this parameter contained the letters rfa the great firewall was associating these searches with Radio Free Asia, a service that has been inaccessible in China for a long time--hence the blockage. We are currently looking at how to resolve this issue.

家园 我试的比你还多

而且我还试了页面内容和URL的各种组合。咱也是曾经啃过RFC的人,在这里面双方能做什么勾当自然是很清楚的。要如何用技术手段来区分谁在做坏事,还是可以做不少工作的。当然某些细节因为资源的限制无法测试。

我承认我很无聊,是真的无聊

因为这个问题其实根本就不应当成为问题。本来我从来不怀疑这个是gfw干的,如果不进行这一系列的试验,那google的形象可以说是非常的cj。但是经过这一系列试验,我只能说,可以证明gfw干了坏事,但却不能证明google是干净的。

有这么个结果,有这么多讨论,某类人应该反省一下了。他们的工作做得实在太差了,起的完全是反效果。

家园 gzip不算什么吧

如果你的http请求说你支持gzip,寄回的应答都是gzip的格式。

家园 解压gzip分析内容对GFW是不可承受之重

GFW之所以是基于入侵检测系统模式而不是防火墙模式,就是因为无法承受大运算量

家园 问题是网上http通讯有很大量都是基于gzip的

如果连这也搞不定,GFW怎么运行?我测过几个国内论坛,我如果在http头上Accept-Encoding里有gzip,过来的都是gzip流,而这是比如说Firefox的缺省配置。

家园 不要说gzip了,GFW连未压缩的内容都不是都检查的

GFW大部分时间是看url,它大部分时候是没有时间查看经过的文本内容。

GFW之所以做成一个入侵检测系统,而不是一个大防火墙模式,就是因为运算能力不足以响应。

家园 空口说白话,建议你把你的论证结果发到it论坛去

如果你很精通RFC,建议你也能为翻墙作出贡献。

家园 根据我看天涯社区的经验,GFW是看内容的

我看的国内论坛绝大部分都没有什么会被GFW的东西,所以不大会碰到GFW给我发送RST。但是天涯社区里的帖子敏感词不少,我这个在国外的要看,有时就会被RST。天涯社区的帖子每页都很长,于是这个被RST的症状往往就是网页内容显示了很多,突然间就变成了“连接被重置”的页面。所以这就说明:GFW的确是双向的,它不但检查和重置国外传向国内的内容,也检查和重置国内传向国外的内容;其次,GFW是浏览网页内容的。

家园 GFW大部分只是单向检查url,而且是不检查内容的

你看看西厢计划第二季的原理就知道了,注意这个和西厢计划没有什么关系

家园 我没说都不看啊,我是说它是根据某些重点url来确定策略的

所以这些重点url应该启用gzip来拖GFW的运算能力。

GFW是双向的,那是因为他先发现了你的发起的目的地,所以才检查。你看看《西厢计划第二季》就知道了。

《西厢计划第二季》能突破GFW的 IP封锁 和 URL关键词过滤 。它的实现原理是利用GFW的单向IP封锁特性,将 发出 的数据包通过国外的第三方服务器中转,而收到的数据包 穿过GFW直接到达客户端 。当用HTTP方式观看在线视频或下载大文件时,对中转服务器仅耗费极小的流量 。同时,由于GFW只能捕捉到单向的流量,无法建立TCP状态机,关键词过滤也就失效了。

家园 那个似乎目的不同

是用来对付封IP和流量检测的。看Youtube和下大文件(一般都是拿诸如rar压缩过的)当然没办法拿关键词去套。我觉得这不说明什么。

英文Wiki关于GFW中写到GFW其中一种检查方法就是对内容的过滤:

Packet filtering

Terminate TCP packet transmissions when a certain number of controversial keywords are detected. This affects all TCP protocols such as HTTP, FTP or POP, but Search engine pages are more likely to be censored. Typical circumvention methods are to use encrypted protocols such as VPN and SSL, to escape the HTML content, or reducing the TCP/IP stack's MTU, thus reducing the amount of text contained in a given packet.

当然这种机制是否总是启动还是在什么条件下启动,都是值得研究的。

全看树展主题 · 分页首页 上页
/ 3
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河