facebook的bigpipe

facebook的bigpipe是一种技术,能使一个网页的加载变得更快。
http://velocity.oreilly.com.cn/ppts/ChanghaoJiang.pdf 这个PPT的39-79页有详细说明。

我们知道一个HTML页面的加载时间主要分为三部分:服务端生成、网络时延、浏览器渲染。
在服务端生成数据的时候,浏览器是处于闲置状态的,反之亦然。
bigpipe的思想就是将页面分块加载,通过巧妙的JS逻辑,尽可能充分的利用服务器和浏览器的时间(见PPT43页)。
此外,为了对搜索引擎友好,也同时支持页面的single flush。

MySQL HandlerSocket Plugin

原文见:http://www.osseye.com/?p=382

说说我的理解,MySQL HandlerSocket Plugin 是一个在 Mysql internal storage engine API 基础上构建的daemon程序。

为什么Mysql internal storage engine API比MySQL直接查询要快?因为直接查询的时候,open/close表的开销占了很高的比例,且互斥竞争比较严重。
MySQL HandlerSocket Plugin绕开了MySQL的client API,对open表的session进行了reuse,并裁剪了很多功能(如SQL parsing, Making Query Plans),实现了一套接近于NoSQL的接口。

我认为大家可以尝试一下这个API,是优化数据库性能的另一条途径。

clicktale & crazyegg

  最近听同事介绍,试用了clicktale,它是一款用户行为跟踪工具。最大的特点是可以回放每个访客的操作流程,包括输入和鼠标轨迹,以及页面跳转。这可为很多网站节约用户体验测试的成本,对改进网站可用性是非常有帮助的。它的Free用户有每月400个PV的限制,且只能回放两个页面。最低的付费价格是59美元每月。打算应用到公司的产品上试用一段时间。
  另外还有一个叫crazyegg的类似站点,它有一个优点是可以自动收集用户的鼠标行为,形成热图(Heatmap)。没有免费的版本,最低价格是每月9美元,限制1万PV的流量。作为抽样研究来说足够了。

办了张电信3G上网卡

  其实是上周二(4月14日)就已经办了,1740元包年,13个月,每个月可以使用300小时的本地流量。最近一周,我分别在东五环、上地、时速80公里的车上、首都机场旁边和燕郊进行了实地使用,信号都是一样的好,速度都是一样的快,下行超过1Mb没有任何问题。
  今天联通出了它未来的3G套餐,貌似150元包月,想钱想疯了?我一直认为接下来联通和移动应该会出一档类似50元100小时之类的套餐,以填补电信资费套餐的空白。没想到它们还生活在太古时代。

git中文教程

  git的英文教程有一些,但中文入门教程目前在国内还很缺乏,一方面是社区对此的贡献还不够,另外一个很重要的原因是国内对其深入理解的程序员也很有限,能亲自把git命令都操作一遍的就更屈指可数了。我的同事前不久编写了一篇浅显易懂的入门教程,供大家参考。本文专门用来进行SEO,希望能带些流量,呵呵。
  教程的地址为 http://hi.baidu.com/eehuang/blog/item/37af8d54242d6351564e00b5.html

  1. 概述
  对于软件版本管理工具,酷讯决定摒弃CVS而转向Git了。
  为什么要选择Git? 你真正学会使用Git时, 你就会觉得这个问题的回答是非常自然的。然而当真正需要用文字来回答时,却觉得文字好像不是那么够用。 咳,该则么回答呢?
  【更多…

使用firefox下载flash视频

  很多人都想把好看的网络视频保存下来,那么如果你使用firefox浏览器的话,只需安装一个叫做Video Downloadhelper的插件即可。这样每当你打开youtube或类似网站的视频时,就会有一个图标在地址栏的右边转动,点击即可选择并下载所需的flash文件了(一般为flv格式),推荐用暴风影音观看。

google calendar sync


  去年11月份,我曾经写过一篇文章,介绍outlook、手机和google calendar之间怎样互相同步数据。当时是采用gsyncit进行outlook和google calendar的同步,这个软件为第三方开发,且需要注册码,还是有些不方便。最近google终于发布了自己编写的outlook同步工具,解决了这个问题。地址在这里:http://www.google.com/support/calendar/bin/answer.py?answer=89955

sphinx

  sphinx是一款基于SQL的全文搜索引擎,可以理解为对MySQL等数据库中全文搜索特性的另外一种实现。它本身可被整合到MySQL等数据库中,成为一种新的存储引擎;此外,还为一些脚本语言设计了API接口。sphinx从功能上讲比较全面。
  它的权重算法也是基于BM25的,这个跟xapian一样,都是目前IR-REL(检索相关度)系列算法里最好的。
  目前有两点还搞不太明白:一是它的切词算法,可能它不是通过切词建立索引的,或者是把每个字都切开?二是它的索引如何和MySQL数据库保持同步,是定期同步还是实时同步?准备深入了解一下,虽然不会有实际用途。