五千年(敝帚自珍)

主题:求助:超大的XML文件用JAVA如何处理? -- spin

共:💬4 🌺1
全看树展主题 · 分页首页 上页
/ 1
下页 末页
家园 求助:超大的XML文件用JAVA如何处理?

大约500MB的XML文件,需要提取某些TAG信息。提取的信息需要保存到数据库中如MYSQL?可以用HASHMAP,VECTOR之类来保存么?

关键词(Tags): #JAVA#XML#数据库
家园 SAX

用SAX遍历取其中片断,时间上开销应该大于使用DOM的方式,但是文件500MB,使用

DOM空间开销太大不可取。我学数学的,可能说的不对

家园 用sax的方式来提取tag信息

用sax的方式来提取tag信息,因为这种方式主要是以事件触发的方式解析xml文件,没有结构信息,不过也可以使用sax管道串联达到部分目的。而dom则是在内存中重建一个结构,然后操作,结构性强,但是太耗内存。jdom等则是介于sax和dom之间的处理方式。

至于,你用HASHMAP,VECTOR等来保存,和解析关系没有关系。

关键词(Tags): #sax
SAX
家园 sax方法应该是可取的。

几年前我解析过一般不超过200M的文件。500M左右的应该可以。

全看树展主题 · 分页首页 上页
/ 1
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河