继续从“寻医问药网”中采集相关数据,昨天采集的是亚健康分类,而今天采集的是根据不同种类的人群的保健内容,人群有电脑族、特殊职业、有车族、孕产妇、中老年;很奇怪把办公室白领这一类人都分在“特殊职业”里。 ...
今天没有什么新的数据库的发现,因此电脑闲着也是闲着,就没事找事的让她采集了一个健康网站的健康中心文章,上万条文章的记录数不是很多,但是详细的分类却将近200个。因为主要是这些分类还可以提取出来创作或者 ...
今天看到一个网站的健康百科模块不错,包含:骨科、急诊、减肥、老人、母婴、男性、女性、眼科、医疗、医院、饮食、整形、中医、综合等,是健康类疾病类产品匹配的数据。具体分类记录统计为:骨科(407)、急诊( ...
今天这个测试类ACCESS数据库与个性测试文章大全的数据结构是一类的属于文单内容类的测试数据,结构好的数据结构在这里,相对于结构好的数据来说这一类的ACCESS数据用途似乎只能做个文章。以下是标题为“ ...
这是从一个职场类网站采集下来的文章内容,分类和记录数都比较多,因为文章来自用户的编辑,所以质量可能有好有坏,如果介意请勿拍。详细情况见表截图,截图下方有显示“共有记录数”。Microsoft Acce ...
今天这份数据是采¥集《散&文&吧》的数据,记录共有6万多条,mdb文件大小为185M,压缩为RAR后为64M,内容出自互联网大众用户,具体台参看源网站。分类情况为:无分类(3246)、 ...
从查字典网站中采集下来的故事会模块,需要注意的是这里所说的故事会并不是杂志《故事会》的故事文章,而是纯碎的故事文章大全,具体可以看载图下的分类情况。分类情况统计:爱情故事(1420)、安徒生童话(17 ...
一个学语文的朋友问我有没有关于中华典故以及万物由来的数据,我看了看手头的资料发现还真没有,而且网上似乎也没有这一类的成品,因此就用程序采集了一个中华典故网的文章。分类统计情况有:成语典故(共4198条 ...
之前搞到过一份近万条的《近万读者200期精华文章ACCESS数据库》,而今天从《读书》1979-2008 全文检索系统中破解出了近万条的精华文章。栏目字段统计:[空](6470)、品书录(1462)、 ...
这是从一个完整的茶文化网站采集下来的完整的内容,2万多条的记录数几乎包含了关于茶信息的所有内容,而且内容格式经过严谨的整理不会显示乱七八遭而是统一干爽的格式。凭此数据库可以创建一个内容建全的茶网站。模 ...