“南开博客聚能”需求分析文档

  “南开博客聚能”是我今天晚上突然冒出来的想法,旨在联合全南开博客网友的实力,推广南开博客文化,鼓励更多网友更新自己的博客,以下是我胡乱写的需求分析。

“南开博客聚能”需求分析文档

一、引言:
编写目的:
为明确软件需求、安排项目规划与进度、组织软件开发与测试,撰写本文档。本文档供项目经理、设计人员、开发人员参考。
二、概述:
“南开博客聚能”是面向南开大学在校学生以及校友的blog编写的免费网络产品,它的宗旨是通过整合这些blog的内容,宣传和推广各个blog。
1.背景:
用户:所有希望宣传和推广自己blog站点的南开大学在校学生以及校友等网友。
技术:基于PHP5+Sqlite或PHP+MySQL开发。
开发周期:1-2周。
2. 目标:
本系统所实现的功能将是利用程序的智能算法,利用各种数据,将各个blog的最新内容整合到一起。
(1)建立查询网站,支持并发访问
(2)可提供面向所有客户的基于HTML和RSS等格式的实用信息
(3)提高数据读取效率
(4)建立多个镜像发布点,规避网络风险,保证数据传输稳定
(5)能随时根据站点数量和内容的变化实现更新和扩展
(6)发布的信息能够鼓励blog作者经常更新自己的站点,能够产生实际的宣传效果
3. 运行模式:
面向用户,在浏览器中直接返回相关数据,包括最新日志和站点信息。
本系统被期望布署为一个数据发布系统和多个数据镜像发布系统,要求有较高可靠性和稳定性。
三、数据描述:
blog最近更新信息,包括站点名称以及日志标题。
四、功能需求:
1.功能划分:
(1)各站点获取数据。
(2)服务器端定期抓取各站点RSS源。
(3)服务器端对抓取到的RSS数据进行分析整合,更新至数据库。
(4)站点提交及管理功能。
(5)各项统计功能。
2.功能描述:
1)各站点获取数据:
在联盟网站的页面内以的方式嵌入Javascript脚本即可。
2)服务器端定期抓取各站点RSS源:
在服务器上定时运行抓取程序,供数据分析程序用。
3)服务器端对抓取到的RSS数据进行分析整合,更新至数据库:
算法设计:
I、 抽取所有RSS源中的相关字段的数据,并过滤恶意和无效记录:
a) 若同一RSS源内任意相邻两篇blog的发表时间间隔小于5分钟,则整个RSS源被判无效,并将该站点的违规记录加一;
b) 若同一RSS源内最近一小时发表的blog大于等于3篇,则仅取最新的3篇blog。
II、 将过滤后的数据更新至数据库。
III、 对数据库中各记录按时间实施排序,取出前若干条记录。
IV、 更新计数:
a) 某站点显示一次该服务提供的信息,该站点对应的主动显示记录计数加一,信息中各站点的被动显示记录加一,10s内重复刷新无效;
b) 某站点或其日志在该服务提供的信息中被点击一次,承载信息的站点对应的主动点击记录加一,被点击的站点对应的被动点击记录加一,60s内重复点击无效。
4)后台管理:
I、 用户提交一个站点
a) 网友在页面提交自己的电子邮件地址、blog站点的RSS地址、站长的联系方式,随后一封确认信件将被寄至信箱;
b) 网友点击信箱中的链接完成注册。
II、 用户修改自己的站点
a) 网友在页面提交自己的电子邮件地址,随后一封确认信件将被寄至信箱;
b) 网友点击信箱中的链接,会出现修改界面,提交即可完成修改。
III、 管理员添加、修改、删除一个站点
a) 需要的信息:站点的RSS地址,站长的联系方式。
IV、 管理员查看最近日志
a) 最近的各项积分增长记录;
b) 最近的违规记录;
c) 若干天内未尽发布信息义务的站点列表。
5)各项统计功能:
I、 南开博客聚能站点排行榜,该排行榜是由站点近若干日各项积分乘以各自的权重并求和而得。
II、 南开博客聚能系统总显示数量,总被点击次数等等。

发表评论

Fill in your details below or click an icon to log in:

WordPress.com 徽标

您正在使用您的 WordPress.com 账号评论。 登出 /  更改 )

Google photo

您正在使用您的 Google 账号评论。 登出 /  更改 )

Twitter picture

您正在使用您的 Twitter 账号评论。 登出 /  更改 )

Facebook photo

您正在使用您的 Facebook 账号评论。 登出 /  更改 )

Connecting to %s