手机浏览器扫描二维码访问
办公室里安静得能听见服务器风扇转动的声音。
李明盯着屏幕,右手放在鼠标上。
他点了一下,屏幕中央的小沙漏开始转。
一秒,两秒,三秒……十秒过去了。
屏幕终于刷新,显示出一列结果。
“还是慢。”他叹了口气。
贾瀞雯站在他身后,看着那些搜索结果。
李明刚才输入的是“电脑价格”,出来的结果有七八条,但只有两条真正和电脑价格有关。
一条是电脑公司的介绍,另一条是去年的旧新闻。
剩下的,有一条是“电影《电脑奇侠》”,还有几条是其他完全不相关的内容。
“准确率多少?”贾瀞雯问。
张涛在另一台电脑前算了一下:“刚测了五十个关键词,只有十五个返回了有用结果。
准确率……百分之三十左右。”
会议室里一片沉默。
五个年轻人都在,脸上的表情都差不多——疲惫,还有点沮丧。
他们已经连续工作了两个月,做出了这个能跑起来的搜索引擎。
可效果实在不理想。
“速度呢?”贾瀞雯又问。
“平均响应时间十二秒。”王磊说,“最慢的一次等了半分钟。
这还只是在我们内网测试,如果放到真实的网络上,有延迟,有带宽限制,可能更慢。”
贾瀞雯点点头。
她走到白板前,看着上面密密麻麻的架构图。
爬虫、索引、分词、排序……每个模块都做了,每个模块都能工作,可组合起来就是这个结果。
“问题出在哪儿?”她问。
李明站起来,走到白板前:“首先是索引结构。
我们现在用的是最简单的倒排索引,但数据量一大,查询效率就低。
需要优化数据结构。”
张涛补充:“分词也有问题。
基于词典的方法太死板,很多新词、专业词切分不准。
比如‘奔腾处理器’,我们的词典里没有这个词,就切成‘奔腾’和‘处理器’,但用户可能搜‘奔腾处理器’整个词。”
“排名算法也不够聪明。”王磊说,“现在基本是按关键词出现次数排序,但这样很容易被垃圾页面钻空子。
一个页面堆满关键词,就能排到前面,可内容根本没价值。”
贾瀞雯听着,一条条记在本子上。
她知道这些技术问题,但她更知道另一个问题——时间。
钱花得比预期快。
这个江湖。有武夫自称天下第二一甲子。有剑仙一剑破甲两千六。有胆小的骑牛道士肩扛两道。但一样是这个江湖,可能是江湖儿郎江湖死,才初出茅庐,便淹死在江湖中。可能对一个未入江湖的稚童来说,抱住了一柄刀,便是抱住了整座江湖。而主角,一刀将江湖捅了个透!临了,喊一声小二,上酒...
简然以为自己嫁了一个普通男人,谁料这个男人摇身一变,成了她公司的总裁大人。不仅如此,他还是亚洲首富帝国集团最神秘的继承者。人前,他是杀伐果断冷血无情的商业帝国掌舵者。人后,他是一头披着羊皮的狼,把她啃得连骨头也不剩。...
啥,老子堂堂的漠北兵王,居然要当奶爸?好吧,看在孩子他妈貌若天仙的份儿上,老子勉强答应了...
陆原语录作为一个超级富二代装穷是一种什么体验?别拦着我,没有人比我更有资格回答这个问题!...
因为,她是真的很想念他,很想,很想,那股想要他的感觉,也越来越强烈。他们本来是夫妻,在这种事情上根本就没有必要压制。而且,此刻她也只是手受伤了而已...
陆家有两个女儿,小女儿是天上的月亮,大女儿是阴沟里的死狗。陆妈你长得不如你妹妹,脑子不如你妹妹,身材不如你妹妹,运气不如你妹妹,你有什么资格过得好,有什么资格幸福?陆微言姐姐,你的钱是我的房子是我的,你男朋友也是我的。你就安心地当又穷又没人要的老处女吧。陆一语凭什么?我也肤白貌美大长腿好么?分分钟能找个男人...