狂人居
Home
Development
About
Manger
网页正文提取算法研究[非正则]
作品
网页正文提取算法研究[非正则] 互联网的页面展现形式相当丰富,但是如果按页面结构特征来分类,却不外乎以下几种类型:首页(包括栏目首页),列表页,内容页,评论页。 (1) 首页: 网站的首页, 一般含有多个栏目、图片、动画,以及若干文章标题链接。如: 网易首页。 (2) 列表页: 信息以列表的方式给出, 一般以表格的形式列出若干个条目, 经常含有分页功能。例...
jabin
发布于
2010-11-11 08:03
218
0
搜索
微语
新笔记组合:思源笔记+七牛+Emlog
jabin
1 个月前
分类
技术 (28)
杂言 (2)
作品 (2)
存档
2022年12月 (2)
2020年12月 (1)
2019年4月 (1)
2018年11月 (2)
2018年8月 (2)
2018年4月 (1)
2016年6月 (1)
2016年5月 (2)
2013年11月 (1)
2013年8月 (1)
2013年4月 (1)
2013年2月 (1)
2012年12月 (1)
2012年9月 (1)
2012年5月 (1)
2012年4月 (1)
2011年12月 (1)
2011年11月 (3)
2011年5月 (1)
2010年11月 (1)
2010年6月 (2)
2010年2月 (1)
2009年12月 (1)
2009年4月 (2)