很久没给这里写东西了.工作,家庭等等.每一样东西都在消耗着我的时间,近来在忙帮朋友写一个分析搜索引擎搜索出来的结果并过滤网页内容的系统.现在基本的功能都实现了.下面我就大概的总结一下此类的软件的程序技术点.
1.获取一个URL的Web源码. (这里涉及到网页的编码转换问题,我的程序是以UTF-8为主的,所有网页下载下来都会转换成UTF-8编码 )
2.利用正则表达式匹配引擎的搜索源码.匹配出想要的信息. 再度正则表达式分析匹配出来的信息,
3.多线程操作
4.自动发邮件.自动注册邮箱.
5.分析http header
6.自动翻译关键字.
7.maxcode加密. 试用版.
该软件支持分析全球27个引擎,支持各国语言的搜索分析.