主题:问一个搜索引擎的问题 -- 大明湖
我想补充几点。
google目前是根据图片的alt属性(附加于网页图片的说明文字,有时候你看图片时,鼠标划过图片时显示的那中文字)和图片的url中含有的文字部分来定位图片的。这就是他们的image搜索的原理。进一步的根据包含图片的网页的上下文来定位的技术,据我所知还没有投入应用。
当然图片还可能有其他的属性,例如建立/修改时间、图片尺寸,索引图(某些格式的图片是支持内嵌那么一张索引图的)、作者、数字水印等,都可能被应用来定位图片。
再比如,若要直接对图片建立索引,可以采用把图片建立一个(缩放到)一定尺寸的小索引图,例如30点*30点,这个数据量就是有限的。忽略掉颜色信息,这个索引图可以按照一定的特征(公式)被归纳成简单的数字或字符串。这个并不困难。然后,我们就有了图象的直接索引了,检索这个索引文件那是一点问题没有。
在计算机能理解图片之前,肯定可以在这些基础上建立起折中的、俺估计效果还不错的图片搜索功能。俺上面说的,都是现在立马就能或已经实现的东西。当然随着算法的改进,其搜索效果可以越来越好。并且我认为主要是算法和数学模型的改进问题,硬件问题不是主要的瓶颈。
本帖一共被 1 帖 引用 (帖内工具实现)
- 相关回复 上下关系8
问一个搜索引擎的问题 大明湖 字140 2005-06-17 05:21:59
懒橱说的接近
现在基于内容的图像检索是一个很热门的题目 2 朝雨 字759 2005-06-18 20:01:38
😉能不能有空给详细说说,加精没商量! Highway 字0 2005-06-18 21:22:23
😄花一吨, 要常来啊. 四月一日 字0 2005-06-18 20:02:46
花一吨. 使用图型文件所附的 Description 或 Key Word, 四月一日 字104 2005-06-18 12:23:03
的确,图片包含的信息很多 大明湖 字136 2005-06-18 12:16:08
困难在于这么做的好处在哪里? 闲杂人等 字1574 2005-06-19 01:01:40