主题网络爬虫关键技术研究

摘
着互联网迅速发展Web信息量越越通搜索引擎互联网搜索想信息百度谷歌搜狗等类搜索引擎称通搜索引擎户提供户想信息着互联网信息量越越户搜索出信息想信息相径庭种问题需更加专业面特定领域搜索引擎解决
题网络爬虫垂直搜索引擎关键部分文题网络爬虫中关键技术进行研究研究容：
（1）题容抽取网页题识重步骤文结合网页容分布特征题容相关特征设计种网页题容抽取方法
（2）提出种基实体链接题识算法识网页题基知识库实体链接方法运特征抽取实验表明该方法提高题网页识准确率
（3）提出种基BestFirst算法题搜索策略题搜索策略指导题网络爬虫抓取网页关键文采基BestFirst算法题搜索策略
关键词：题网络爬虫实体链接BestFirst算法题搜索策略

第章绪
11 背景意义
着Internet飞速发展互联网信息呈指数增长根中国互联网络信息中心（CNNIC）发布第40次中国互联网络发展状况统计报告[1]数显示截2017年6月中国网民规模达751亿占全球网民总数五分互联网普率543中国网站数量506万半年增长48
量网站中包含着计数网页网页信息载体般通百度谷歌等通搜索引擎互联网获取想信息然利通搜索引擎搜索出信息较宽泛垂直搜索引擎针特定行业通搜索引擎细分某领域网页信息进行整合处理某种形式返回户垂直搜索针引擎某领域特定户特定需求提供相关信息服务垂直搜索引擎专注某领域专业显更加专注具体深入
题网络爬虫称聚焦爬虫垂直搜索引擎重组成部分题网络爬虫研究具重意义题网络爬虫动互联网抓取网页程序根预设题访问互联网题相关链接获取网页信息通网络爬虫干种子链接开始先抓取种子链接网页然网页中抽取新链接放入抓取队列中直满足系统设定抓取结束条件者抓取队列空相题网络爬虫抓取流程较复杂抓取程中需预测链接题相似度然放入根题相似度排序抓取队列中
12 题网络爬虫国外研究现状
1999 年SChakrabani[2]第次提出聚焦爬虫概念设计实现 Focus Proiect 系统[3]该技术提出快获广泛关注接理实现系统两方面介绍题网络爬虫国外研究现状
121 题识算法题搜索策略
PDeBra[4]等提出利FishSearch 算法作爬虫搜索策略该算法假设题相关页面逻辑相接搜索题相关网页SharkSearch 爬虫[5]FishSearch算法基础进行改进FishSearch算法利二值模型评估题相关性SharkSearch算法根链接锚文网页题相关容计算出相关性值[01]值该算法提高题爬虫召回率 BestFirst爬虫[6] CHO J 等 1998 年提出思想构建抓取队列评价策略队列中链接进行评价挑选链接进行抓取
Larry Page Sergey Brin[7]提出 PageRank 算法运Google搜索引擎leinberg博士首先提出HITS算法
Diligenti[8]利语境图构造分类器作爬虫搜索策略题页面较页面会优先抓取认部分页面题相关度较高
陈军[13]提出种基网页分块 SharkSearch 算法该算法块基单位计算链接价值熊忠阳[14]等提出种基信息增益题爬虫搜索策略
122 题爬虫系统
根理研究国外专家设计实现高效题爬虫系统
（1）Scirus系统Scirus系统[15]Elsevier ScienceFAST合作开发垂直搜索引擎学生科研工作者服务该系统次评佳垂直搜索引擎
（2）美国国家数字科学图书馆 Collection Building Programe（CBP）系统该系统面科学数学线数字图书操作简单户需输入简单查询信息查询相关度较高链接
（3）NEC 研究院 CiteSeer 系统该系统面计算机领域科学文检索系统
（4） STIP系统该系统中科院文献情报中心实施中科院文献信息享系统子课题面科技信息类资源
（5）南京学互联网数采集系统（IDGS)该系统釆模式匹配技术实现动搜索互联网中英文技术资料
（6）北天网该系统[16]采组关键词表示题爬虫利组题关键词策略互联网中抓取数快全面抓取某题相关信息资源
（7）题信息采集系统Gsearch周鑫等设计实现Gsearch 系统[17]企业决策支持行业市场分析等领域着广泛引前景
13 文研究容
文通网络爬虫基础通引入网页题容提取基实体链接题识算法识题网页然基BestFirst算法题搜索策略指导题网络爬虫互联网抓取题相关网页
文研究容：
（1）集合网页容分布特征题容相关特征设计种网页题容抽取方法
（2）题网页识方面采基实体链接题识算法识题网页
（3）搜索策略采基BestFirst算法题搜索策略指导题网络爬虫抓取题相关网页
文分六章篇节安排：
第章绪介绍研究背景意义题网络爬虫国外研究现状文研究容篇章结构
第二章介绍爬虫体系结构通介绍通网络爬虫题网络爬虫体系结构阐述题网络爬虫通网络爬虫区
第三章介绍网页题容抽取先介绍HTML结构然介绍网页解析网页进行噪处理阐述抽取网页题容分词相关容
第四章重点介绍基实体链接题识算法部分介绍
介绍实体链接题链接运特征抽取中进提高题识算法准确率
第五章提出基BestFirst算法题搜索策略首先介绍通网络爬虫搜索策略相关算法然介绍两种题搜索策略相关较代表性算法详细阐述文研究基BestFirst算法题搜索策略
第六章文工作进行总结展
第二章题网络爬虫体系结构
21 组成模块
211 基组成
图21题网络爬虫体系结构图

图21 题网络爬虫体系结构
图示题网络爬虫分5部分载题容抽取题网页识链接评价模块
(1) 载模块
网络爬虫说载网页始终工作载模块需考虑方面素：利线程载网页线程载中资源调度重外设定超时机制舍弃掉等时间长网页提高爬虫性
(2) 题容抽取
题网络爬虫需细致分析网页题容抽取程度影响网页题识噪音容会影响续网页题识效果需消噪消噪预处理包括网页题容提取中文分词停词删等操作
(3) 题网页识
文通判断网页容否题相关题网页进行识文中题预设某类信息资源统称题选择题信息抽取第步网页题组题相关特征表示
文文分类技术识网页题程选定定题题相关数训练集特征量表示网页然利分类算法进行分类首先特征量表示网页然利分类算法进行分类
(4) 链接题相关性评价抽取
首先掉明显广告链接然相链接转换绝链接评估链接题相关性放入抓取队列中链接题相关性计算题考虑父页面链接锚文题相关性
212 基流程
爬虫基流程分成载程网页分析程两程载程务抓取链接队列中获取链接然互联网载网页网页分析包括网页题容抽取题网页识两步骤
(1) 载程
step1 调度模块提取链接队列中链接然启动相应数量载线程
step2 载线程建立会话
step3建立连接然载网页
step4讲网页存储然次获取载链接转step3果已没载链接线程退出
(2) 网页分析程
step1 网页预处理模块先原始网页构建成dom树
step2 抽取出网页中锚文文节点分存放两容器：anchorstexts中
step3 滤掉关节点
step4 滤噪音文
step5 根网页题容特征进步抽取出网页题容
step6 抽取出网页题容进行分词处理
step7 提取特征分类特征量代表网页
step8 预先训练网页集合训练基朴素贝叶斯算法分类器分类量分类器分类判断否题相关
step9 果网页题相关网页保存网页库
step10 anchors中锚节点剔链接评估链接题相关度新链接题相关度存抓取链接队列中
22 题页面分布特性
题页面分布符合四特性HubAuthority特性LinkagesiblingLocality特性站点题特性隧道特性
221 HubAuthority特性
美国康奈尔学Kleinberg教授发现页面体分成两种中心页面权威页面中心页面含许链接外种页面权威页面种页面倾说明单题Kleinberg教授页面引入HubAuthority值体现述特性[18]种特性提出HITS算法
222 LinkageSibling Locality特性
Linkage特性指网页包含链接指网页题通常该题题相关Sibling Locality特性指网页区域链接通常题相关[19]
223 站点题特性
站点包含题相关题页面聚集起题页面团间链接较少
224 隧道特性
题页面分布种特性站点题页面团会通题关链接连接起链接横跨题页面团间隧道隧道特性抓取程中隧道会影响抓取效率
23 搜索策略链接提取
搜索策略网络爬虫爬虫互联网抓取网页核心程度决定爬虫效率中部分链接需根相关协议排掉
231 robots协议相链接转换
2311 robotstxt文件META标签
（1）robotstxt网站容希爬虫抓取ROBOTS开发界提供两解决方案robotstxtMETA标签robotstxt存放网站根目录文件名写纯文文件网站中想网络爬虫访问部分该文件中申明
robotstxt文件包含许记录条记录格式示

robotstxt文件针整网站描述站点爬虫访问情况META标签单具体页面
（2）META标签中没写分nameRobots表示作网络爬虫针某具体网络爬虫写nameBaiduSpider
2312 相链接转换
相URL服务器相URL文档相URL绝URL格式
scheme serverpathresource
中scheme指定资源协议httpmailtoftp等协议server指资源服务器名称wwwbaiducompath指达资源路径18040209resource通常文件名DECL75C900118017html单二进制流简单文件结构化文档定位资源信息包括绝URL中
相URL相某网页位置目标链接现实环境中网站服务器发生变更会引发链接错误相链接指服务器网页前网页位置般视特定网页位置者base标签定义该网页中链接httpmobile163com前缀
232 搜索策略概述
通网络爬虫较高覆盖率般采图广度优先策略遍历互联网网页题网络爬虫需搜索容会针特定题需遍历整网络需选择题相关网页进行遍历
题网络爬虫通常采优先原互联网搜索网页次价值链接进行访问高效获取更题相关网页题网络爬虫搜索策略链接价值评价方法决定链接包含页面容中般父页面价值高包含链接般具较高价值评价链接价值结合网页容分析
24 章结
章概述题网络爬虫基流程组成部分介绍链接提取规介绍网络爬虫搜索策略概念
第三章网页题容抽取
31 HTML简介
目前部分网页HTML编写网页通超链接链接起进形成紧密连接起网络结构
通网络爬虫说需抽取网页中链接然题网络爬虫需分析提取网页容然链接进行价值评估进行取舍致标签分三类
（1）网页进行布局标签常标签

等
（2）描述信息显示特点标签常重信息标签
等十种
（3）包含超链接标签超链接连接页面表示网页间关系类标签等
HTML文档头部(head)体(body)组成[20]
HTML文档两部分
（1）头部区段
（2）体区段包含标签标题文段落换行非换行空格标线列表文属性标签属性标签名组成属性属性名应属性值组成属性求引号文会忽略掉容关标签包含容助消噪音
32 网页文件解析
HTML文件般dom树表示解释HTML文件程字符流表示成HTML树[21]程
html文档表示成图31示html树

标题<title><br > <head><br > <body><br > <table><br > <tr><br > <a hrefhttpwwwbaiducom>百度<a><br > <a hrefhttpwww163com>网易<a><br > <tr><br > <tr><br > <p>段落<p><br > <tr><br > <table><br > <body><br > <html><br >述html文件树结构表示图31示<br > <br >图31 html文件树结构<br > 目前构造标签树工具：htmlParserW3C HTML lexical analyzer[22]等<br >33 网页噪<br >许网页包含题容关容图32示新闻网页截图网页认正文块外部分噪音<br ><br >图32 网页正文块<br >网页截图出网页正文块外余部分广告导航链接搜索服务等组成<br >题搜索领域量噪音容会导致题漂移提取题相关容时果原始网页中噪音容容易噪音容作题相关容影响网页题识<br ><br >331 利统计学噪<br >统计方法噪[23]流程<br >(1) 删噪音块：网页噪基方法利种通特征区分效正文页眉页脚广告等信息中常特征链接文字率根链接文字率滤掉噪音<br >(2) 划分段落HTML页面划分成段落(Paragraph)简单实现方法根<td><p><br><div><table>标签划分段落<br >(3) 评估段落段落文字视觉者题文档贡献程度具权重选取分值段落正文块<br >流程图：<br ><br >图33 噪流程<br >34 题容抽取<br >网页题容抽取网页题识第步题容抽取准确率直接影响网页题识准确率刘军等[24]（基DOM网页题信息抽取）提出构建文档象模型DOM树然添加显示语义等属性解决HTML文档半结构化足提出种聚类规进行分块提取出题信息基础通量网页分析发现正文容块网页标题(title标签容)meta标签属性content容携带网页题信息抽取时候部分容应该抽取网页般分索引型网页题型网页网页题识针题型网页题网页包含链接文广告等题关文应该先掉然应掉网页版信息等题关噪音文综述网页题容抽取算法：<br > Step1首先选取plitdh1作分块节点<br > Step2网页a标签容<br > Step3获取title标签中文然删title标签容<br > Step4获取meta标签属性content值然删meta标签<br > Step5p标签进行3相操作<br > Step6li标签进行3相操作<br > Step7td标签进行3相操作<br > Step8h1标签进行3相操作<br >取？标点符号作分块节点特征果节点中文包含特征认容题相关进行抽取<br >35 章结<br >章先介绍网页处理中种预处理程包括HTML解析网页消噪提取网页中容必剔原始网页噪音然根网页题容特征提取出网页题容<br >第四章基实体链接题识算法<br >41 实体链接简介<br >介绍实体链接前首先需解实体概念实体存世界某象者象集合实体般属性描述<br >实体链接文中实体表述链接知识库中相应实体程[29]实体链接中知识库包括WikipediaFreebaseYAGODBpedia等[30]目前复旦学图数理实验室知识工厂构建知识库提供较全面接口文知识工厂提供知识库相关接口段文中实体链接两件事方便识出文中实体指称方面识出实体指称知识库中相应实体相关联然语言中普遍存义名现象需根文中实体表述文信息确定实体表述指实体实体链接包含两项关键技术：实体识实体消歧实体识[31]指识文中实体表述实体表述指实体词者短语实体消歧[32]指定实体指称文候选实体判断前文中指实体程<br >42 CNDBpedia<br >CNDBpedia[33]复旦学知识工场实验室（Knowledge Works）研发维护规模通领域结构化百科前身复旦GDM中文知识图谱国早推出目前规模开放百科中文知识图谱涵盖数千万实体数亿级关系CNDBpedia通百科知识沉淀线垂直深领域图谱积累支线致力机器语义理解提供丰富背景知识实现机器语言认知提供必支撑CNDBpedia已百科领域延伸法律工商金融文娱科技军事教育医疗等十垂直领域类行业智化应提供支撑性知识服务目前已百家单位CNDBpedia具体量巨质量精良实时更新丰富API服务等特色CNDBpedia已成业界开放中文知识图谱首选文CNDBpedia作知识库利知识工厂提供相关接口识文中实体然进行利提供接口进行实体链接<br >例文<br ><br >图 41<br ><br >调知识工厂接口获取结果<br ><br >图 42<br >中cuts字段文词集合entities字段识出文中实体<br >然调知识工厂提供获取知识库中实体详情接口获取实体信息示<br ><br >图 43<br >中status表示接口调状态ret字段表示获取结果中包含实体详细信息拼音中文名称外文名称CATEGORY_ZHDESC<br >述程识文中实体链接知识库中获取实体信息程实体链接程<br >43 基实体链接特征抽取<br >特征抽取题识说特重步抽取出特征准确否决定着题识准确率传统方式分词问题法某题特征抽取出文实体链接引入特征抽取程中知识库支撑更加准确题特征抽取出<br >431 候选特征集合抽取<br >首先训练语料中抽取出候选特征集合[34]<br ><br >图 44<br >图示具体步骤：<br >(1)准备训练语料准备干题相关文<br >(2)实体链接处理知识工厂接口题相关文逐句进行实体识分词获取实体信息实体信息中抽取出更候选特征<br >(3)获取候选特征集合步获取词集合进行重停词处理获取候选特征集合<br >搜狗语料中选择军事题相关50篇新闻文章作选择候选特征语料集合首先利知识工程接口语料文章进行分词识语料文章实体知识库支撑更文章中潜特征切分出识出实体进行实体链接获取实体信息图示：<br ><br >图 45<br >图示实体防空导弹实体信息中称类CATEGORY_ZH属性抽取出合候选特征集合中DESC属性加入提取候选特征语料集合中做进步处理<br >述基实体链接方式知识库支撑方面较准确潜特征抽取出方面抽取特征训练语料限实体信息中抽取出更特征<br >图示实体链接挑选出候选特征集合实例<br ><br >图 46<br >432 常见特征抽取算法<br > 目前常特征选择算法：文档频率[35]信息增益[36]互信息[37]词条统计[38]等<br >（1）文档频率 <br >训练语料中包含某词语文档条数该词语文档频率该方法基思想：出现频率较低词语携带少信息量法类区分开删较低频率词语样降低特征维度提高分类准确率<br >（2）信息增益（Information Gain）<br >信息增益（IG）计算某特征出现出现出现两种情况系统携带信息量差值文分类言包含特征词 t包含特征词t文档频数差值代表特征词tIG值IG值采公式计算：<br > (41)<br > 公式中表示类文档语料中出现概率表示语料中包含词语文档概率表示文档包含词语时属类条件概率表示语料中包含词语文档概率表示文档包含词语时属类条件概率表示类数<br >（3） CHI统计<br >CHI统计常常称开方统计检验两变量否独立两变量相互独立前提样实际观测值理值偏离程度计算出表示CHI值CHI值越两变量趋相关反两变量趋独立<br >特征词文档类相关程度方式衡量先预设词条某类独立基础计算出词条CHI值越说明结果假设偏差越该词条类越相关该方法特征选择程计算词条类CHI值排序前值特征词语类CHI值计算公式：<br > (42)<br >（4）互信息（Mutual Information）<br >信息中互信息（MI）表示两事件发生相关联提供信息量互信息量越相关性越<br >词语类互信息计算公式：<br >（43）<br >公式(43)中ABCDN含义公式（42）中致<br >实验表明信息增益较效进行特征提取文采信息增益算法进行特征提取<br >433 终特征抽取<br >候选特征集合基础抽取终特征集合具体步骤：<br ><br >图 47<br >(1)计算信息增益值训练语料中计算候选特征集合中特征信息增益值<br >(2)获取特征信息增益值递减排序选择前干特征<br >(4)获取终特征实体信息中获取特征加入（2）步骤中获取特征集合中特征集合作终特征集合<br >44 基朴素贝叶斯算法分类器<br >文采朴素贝叶斯算法构造分类器<br >假设特征集合表示实例A类c某限集合C中取值现提供训练实例集测试实例(a1a2…am)<br >需分类实例A目标获取实例(a1a2…am)类标记：<br > （44）<br >现做基训练实例集估计式(414)中两概率值<br >朴素贝叶斯分类器(naïve Bayes classifiers)[39]假定：定类标记时属性值间相互条件独立说联合概率正单独特征概率积具体公式：<br > (45)<br >代入式（414）中朴素贝叶斯分类器分类公式：<br > (46)<br >式中x第j特征值概率p(c)通计算训练实例集中类特征值组合出现频率简单计算具体公式<br > (47)<br > (48)<br >式中n训练实例数第i训练实例类标记第i训练实例第j属性值二值函数时l否0<br >显然出现零频率属性值时候种方法会导致低估计概率更极端情况会某概率值0进导致式(46)计算整量0常常Laplace估计进行滑处理进避免述问题重写式(47)式(48)<br > (49)<br > (410)<br >式中类数训练实例第属性取值数<br >基实体链接朴素贝叶斯分类器整体框架图33示<br ><br >图 48<br >工作流程：<br >(1)基实体链接特征抽取方法进行特征提取<br >(2)根获取特征集合构建朴素贝叶斯分类器进行训练<br >(3)爬虫抓取网页进行预处理包括题信息抽取分词等预处理然网页量化表示<br >(4)利分类器量化处理网页进行题识果网页属题类网页保存题页面库否舍弃该页面<br >45 实验分析<br >节通实验验证章提出基实体链接朴素贝叶斯分类器题识中效果<br >题识效果评判采三指标：准确率(P)召回率(R)F值[40]准确率表示准确识出题相关文数量例召回率准确识出题相关文数量训练集中题相关文数量例F值综合评价指标假定：训练语料中属题相关判定题相关文a题关判定题相关文数目b属题相关未判定题相关文数量c三评价指标计算公式：<br >准确率： <br >召回率： <br >F值： <br >现搜狗新闻语料中选择军事（587篇）非军事(856篇)文章计1443篇作训练语料章提出基实体链接方法构建朴素贝叶斯分类器进行实验实验结果：<br >表41 实验结果<br ><br >识出题相关文<br >识正确文<br >准确率(P)<br >召回率(R)<br >F值(F)<br >NB<br >613<br >516<br >842<br >879<br >86<br >基实体链接NB<br >627<br >552<br >80<br >94<br >909<br ><br >实验结果相传统朴素贝叶斯分类器引入实体链接技术进行改进取较效果<br >46 章结<br >章介绍基实体链接朴素贝叶斯分类器首先介绍实体链接相关概念接着介绍文知识库CNDBpedia相关接口然重点阐述基实体链接特征抽取方法实体链接技术运特征抽取中更提取出题相关特征接着详细介绍基朴素贝叶斯算法分类器构造工作流程通实验分析证明章提出基实体链接题识算法取较效果<br ><br >第五章基BestFirst算法题搜索策略<br >搜索策略爬虫预设种爬行方法指导网络爬虫抓取互联网网页章前基础设计种题爬虫策略指导题爬虫抓取网页<br >51 通搜索策略<br >互联网成复杂庞非连通图[41]参图遍历方法通网络爬虫般两种遍历策略广度优先策略深度优先策略[42]<br ><br >图51 网络链接结构图<br >图51简单网络链接结构图中网络中网页节点表示链接边表示深度优先搜索思路爬虫着某方直搜索直方没继续搜索节点换方继续进行图51例爬虫搜索序ABDECFG广度限搜索策略思路远层层抓取搜索网络节点样图51代表网络结构例中A节点第层页面BC节点第二层页面DEFG第三层页面广度优先策略爬虫抓取网页路径ABCDEFG<br >理说两种搜索策略行真实环境互联网庞复杂深度优先策略会陷入某方般网页层次越深价值越低通网络爬虫般采广度优先策略然通常通网络爬虫追求覆盖率抓取资源价值高<br > <br >52 常题搜索策略<br >题网络爬虫目标抓取定题相关网页需预测链接容题相关性然决定否进行抓取通搜索策略题搜索策略题指导链接价值进行评估根链接题相关性链接插入抓取队列中选择题相关度高链接继续抓取[43]样题网络爬虫快抓取题相关网页提高抓取效率<br >年题搜索策略分两类：种基容评价种基链接结构评价[44]<br >521 基容评价搜索策略<br >该搜索策略通分析网页容题相关性指导题网络爬虫抓取网页面通介绍算法类搜索策略进行分析<br >（1）BestFirst算法<br >佳优先搜索（Best First Search）种启发式搜索算法做广度优先搜索算法种改进佳优先搜索算法广度优先搜索基础启发估价函数遍历点进行评价然选择代价进行遍历直找目标节点者遍历完点做题网络爬虫搜索策略基思路链接价值进行评估优先抓取价值高链接指网页<br >（2）FishSearch算法<br >De Bra等提出FishSearch算法该算法模拟鱼群觅食行该算法假设链接条鱼该链接页面中链接代表鱼代果鱼找事务链接找题相关页面继续方继续搜索反果鱼找食物代变虚弱方找题相关页面次寻找直线路链接方重新开始搜索<br >（3） SharkSearch算法<br >FishSearch算法二值模型判断鱼否找食物样法精确链接优先队列进行排序Hersovici 提出SharkSearch算法改进FishSearch算法相关度般01间取值[44]<br >521 基链接结构评价搜索策略<br >基链接结构评价搜索策略中PageRank 算法 Hits 算法基础典型两种算法<br >（1）PageRank 算法<br >定义入度出度概念入度指网页链接出度网页中指页面链接PageRank 算法入度出度链接价值进行评估<br >页面 A PageRank计算公式<br > （51）<br >公式中：代表网页 A PageRank 值代表链接 A 网页 PageRank 值代表网页 Ti出度d 阻尼系数起调控作 0 1 间取值般设置 d 085<br >（2）HITS 算法<br >HITS 算法基流程：<br >1）网页 i 具两特征分值：中心度h(i)权威度a(i)初始情况 h(i)1a(i)1<br >2）次通迭代计算页面中心度权威度<br >网页中心度 h (i)：<br >网页权威度 a (i)：<br >标准化处理：中|h(i)||a(i)|分代表网页集合里中心度权威度<br >3）断重复 2)程计算轮迭代权值轮迭代权值差异果二者差异较说明系统已趋稳定<br >53 基BestFirst算法题搜索策略<br >531 链接价值评估 <br >BestFirst算法基思想构建抓取链接列表然中选择价值链接进行搜索通常利页面容题相似度页面价值进行评估利量空间模型表示页面欧式距离权重计算相结合方法计算出页面题间相关性计算公式：<br > （52）<br >公式欧式距离计算公式基础进行化取反处理公式中qp分表示题量页面特征量量维数n表示特征关键字i页面p中权重表示k题量q中权重权重采TFIDF方式计算<br >公式表示计算值0表示网页量题量相似度低计算值1时表示网页量题量相似度高<br >题相关网页非链接题相关反题相关网页定链接题关[46]链接价值应该两部分评估部分链接继承父页面价值部分链接锚文<br >假设父页面量表示d1链接锚文量表示d2题量表示q通前文分析终计算链接价值公式<br > (53)<br >531 题搜索策略<br >文搜索策略赖两队列指导题网络爬虫抓取网络网页资源抓取链接队列已抓取链接队列中抓取链接队列文搜索策略关键<br >抓取链接队列示例<br >[{depth2 urlhttptechsinacomcnmobilenapple20150212081510009651shtm l <br >thematicCorrelationVal08}]<br >抓取链接队列结构示三元素组成：urldepththematicCorrelationValurl表示抓取链接depth表示链接深度thematicCorrelationVal表示链接计算出题相关度抓取链接队列题相关度递减排序序队列<br >搜索策略基思路：先种子链接开始抓取抽取页面链接计算链接题相关度链接题相关度插入抓取链接队列中详情图示：<br ><br >图 52<br >图流程具体步骤<br >(1) 初始化种子列表步骤需种子列表初始化入抓取链接列表步骤种子链接深度设0题相似度设1然需预设抓取深度<br >(2) 抓取链接队列中获取链接<br >(3) 判断抓取链接否已抓取链接队列判断抓取链接否已抓取链接队列中果存跳步骤(5)<br >(4) 丢弃抓取链接<br >(5) 抓取链接队列否空判断抓取列表否空果空结束<br >(6) 链接深度否超预设抓取深度值判断抓取链接深度否超预设抓取深度值果超跳转步骤(4)<br >(7) 抓取页面根链接抓取网页<br >(8) 抽取页面容链接<br >(9) 计算链接题相似度计算抽取出链接相似度丢弃掉题相似度0链接题相似度0链接插入带抽取链接队列中<br >(10) 已抓取链接放入已抓取链接队列中抓取链接放入已抓取链接队列中然跳转步骤(5)<br >532 实验分析<br > 实验基思路：设定步长调节公式(53)中参数寻找优阈值<br > 文选取汽车题选取网易新浪两流网站链接作种子链接设定搜索深度depth3参数步长01<br >采收获方式评价抓取效率收获（Harvest Rate）收获(Harvest Rate)抓取网页中题相关网页数目占抓取网页总数率相应计算公式：<br > (51)<br >中pages_downloadeds代表抓取网页总数relevant_pages表示网页中题相关网页数量<br ><br >图 53<br >图示取值06时取较效果<br >54 章结<br >节介绍题搜索策略研究首先介绍通搜索策略然介绍目前常两种题搜索策略分介绍两种搜索策略中较典型题搜索策略算法然详细阐述文采题搜索策略实验验证该题搜索策略取较效果<br > 第六章总结展<br >61 总结<br >互联网高速发展网络信息爆发时增长信息庞杂乱通搜索引擎容陈旧查全率查准率偏低信息冗余等问题越越满足户特定需求针特定搜索领域垂直搜索引擎逐渐成研究热点<br > 文现题网络爬虫研究基础进步进行探索改进方式进行详细阐述<br >(1) 提高爬虫网页题识准确率文网页预处理模块中细致分析网页构建网页树网页树进行减枝然网页消噪网页预处理重步骤<br >(2) 文提出基实体链接题识算法通实体链接更加准确更获取特征提高题识准确性<br >(3) 文提出基BestFirst算法题搜索策略通综合父页面题相关度链接锚文题相似度综合评估链接价值然根链接价值决定抓取网页序<br >62 展<br >文设计题网络爬虫搜索策略架构方面做定改进注意问题<br >方面网页容分析果更网页噪音利统计学视觉<br >方面搜索策略尝试结合链接结构评价方式提高题网络爬虫爬行效率<br >文档香网(httpswwwxiangdangnet)户传<br ><br />《香当网》用户分享的内容，不代表《香当网》观点或立场，请自行判断内容的真实性和可靠性！<br />该内容是文档的文本内容，更好的格式请下载文档<br /></div></article> <div id="reader-more"> <p class="title">下载文档，方便阅读与编辑</p> <p class="gray"> 文档的实际排版效果，会与网站的显示效果略有不同！！</p> <p class="download-info"> <span style="font-size: 14px;color: #888888">需要</span> <span style="font-size: 24px;">5</span> <span style="font-size: 14px;padding-right: 20px;color: #888888">香币</span> <a href="javascript:void(null);" onclick="JC.redirect('/create')" style="color: #cf6a07"> [ 分享文档获得香币 ] </a> </p> <p class="ut-mt20"> <a class="button-xd pure-button download buy circle80 fs30" href="javascript:void(null);" data-type="3" data-num="5" data-download="true"><i aria-hidden="true" class="fa fa-yen"> </i> 购买文档</a> </p> </div> <section class="mip-box ut-mt10"> <section class="mip-box-heading"><h3> 相关文档</h3></section> <section class="mip-box-body"> <div class="ui-list content"> <a class="pure-g ui-item" data-type="mip" href="/doc/5737515716250043383.html" title="Python网络爬虫及数据可视化"><div class=" pure-u-1-6 cover"><mip-img src="https://sdoc.xiangdang.net/image/9752273120a09d3baf3f78f4f6792d5a_thumb" alt=""></mip-img> </div><div class="info pure-u-5-6"><h2 class="title">Python网络爬虫及数据可视化</h2><p>Python网络爬虫及数据可视化Python网络爬虫及数据可视化摘要随着4G的全面普及，以及5G基站建设开展，带来互联网相关产业的高速发展，电子数据的爆发式增长。对于互联网公司来说，海量用户带来的巨量数据就是待挖掘的金矿，同时数据也是互联网公司的生命线。获取海量的数据如果通过人工一一进行获取，速度缓慢，耗费时间长，效率低下，对于此痛点，网络爬虫是最好的选择，通过</p><p class="extra"><span>平***苏 </span>3年前上传<span class=" pull-right">730 <i aria-hidden="true" class="fa fa-eye"></i> 0 <i aria-hidden="true" class="fa fa-thumbs-o-up"></i></span></p></div></a> <a class="pure-g ui-item" data-type="mip" href="/doc/5043389909314780801.html" title="XX地区优势主导花卉品种生产关键技术研究与示范"><div class=" pure-u-1-6 cover"><mip-img src="https://sdoc.xiangdang.net/image/b2629105cf5d5d1dc390a0860be9c3d0_thumb" alt=""></mip-img> </div><div class="info pure-u-5-6"><h2 class="title">XX地区优势主导花卉品种生产关键技术研究与示范</h2><p>花卉产业是一项集经济、社会、生态效益于一体的绿色产业，也是农业领域中的朝阳产业之一。目前世界花卉生产面积约410万公顷，全球花卉产业总产值已达到8000亿美元，并以每年10%左右的速度递增，到2015年全球花卉消费已超过5000亿美元，世界花卉产业全球转移趋势加强，花卉生产已由西欧、北美和亚洲的日本等发达地区转向自然气候条件优越、劳动力价格比较低的发展中国家和地区。</p><p class="extra"><span>l***u </span>5年前上传<span class=" pull-right">951 <i aria-hidden="true" class="fa fa-eye"></i> 0 <i aria-hidden="true" class="fa fa-thumbs-o-up"></i></span></p></div></a> <a class="pure-g ui-item" data-type="mip" href="/doc/5043389908931449248.html" title="xx地区优势主导花卉品种生产关键技术研究与示范"><div class=" pure-u-1-6 cover"><mip-img src="https://sdoc.xiangdang.net/image/d1bd94b3e09b7ebc2e53d6bb17458214_thumb" alt=""></mip-img> </div><div class="info pure-u-5-6"><h2 class="title">xx地区优势主导花卉品种生产关键技术研究与示范</h2><p>1、本申请书适用于重点领域科技攻关计划项目、**重点产业支撑计划项目、区域创新引导计划项目的申报。2、所属领域为：现代农业领域、社会发展领域、高新技术领域。3、申报单位可根据申请指南、申报项目的研究内容自行确定所申报项目的项目名称。项目名称应清晰、准确反映研究内容，项目名称不宜宽泛。4、通过兵团科技管理信息系统按照系统提示在线填写申报书，请按照申报书的基本格式撰写申报书。申报书标题，统一用黑体四号字。申报书正文部分，统一用宋体小四号字填写。正文（包括标题）行距为1.5倍。凡不填写的内容，请用“无”表示。</p><p class="extra"><span>l***u </span>5年前上传<span class=" pull-right">1012 <i aria-hidden="true" class="fa fa-eye"></i> 0 <i aria-hidden="true" class="fa fa-thumbs-o-up"></i></span></p></div></a> <a class="pure-g ui-item" data-type="mip" href="/doc/5352786366945938335.html" title="爬虫接入规范"><div class=" pure-u-1-6 cover"><mip-img src="https://sdoc.xiangdang.net/image/652d84029280fa3e685063ab76d5ec6f_thumb" alt=""></mip-img> </div><div class="info pure-u-5-6"><h2 class="title">爬虫接入规范</h2><p>爬虫接入规范修订历史日期修改说明部门修改人2018.06.12大数据中心李永波数据接入需求基于数据采集需求，初步判断数据的接入源是否从业务数据库中获取。联系技术研发部同事，请求数据源接入的位置参数，通过配置化方式达到将数据从业务系统拉取、装载到数据仓库贴源层的目的。数据接入流程1. 与爬虫组和平台组进行沟通，确定提供数据的方式（数据库、文件、接口等），让需求</p><p class="extra"><span>h***y </span>4年前上传<span class=" pull-right">601 <i aria-hidden="true" class="fa fa-eye"></i> 0 <i aria-hidden="true" class="fa fa-thumbs-o-up"></i></span></p></div></a> <a class="pure-g ui-item" data-type="mip" href="/doc/5043389909708231108.html" title="项目申报书：＊＊地区优势主导花卉品种生产关键技术研究与示范"><div class=" pure-u-1-6 cover"><mip-img src="https://sdoc.xiangdang.net/image/c60af165427535554c9156f1be6f4c68_thumb" alt=""></mip-img> </div><div class="info pure-u-5-6"><h2 class="title">项目申报书：＊＊地区优势主导花卉品种生产关键技术研究与示范</h2><p>花卉产业是一项集经济、社会、生态效益于一体的绿色产业，也是农业领域中的朝阳产业之一。目前世界花卉生产面积约410万公顷，全球花卉产业总产值已达到8000亿美元，并以每年10%左右的速度递增，到2015年全球花卉消费已超过5000亿美元，世界花卉产业全球转移趋势加强，花卉生产已由西欧、北美和亚洲的日本等发达地区转向自然气候条件优越、劳动力价格比较低的发展中国家和地区。</p><p class="extra"><span>l***u </span>5年前上传<span class=" pull-right">1459 <i aria-hidden="true" class="fa fa-eye"></i> 0 <i aria-hidden="true" class="fa fa-thumbs-o-up"></i></span></p></div></a> <a class="pure-g ui-item" data-type="mip" href="/doc/5730950176606127650.html" title="局域网技术研究网络协议研究"><div class=" pure-u-1-6 cover"><mip-img src="https://sdoc.xiangdang.net/image/f2a2f8b11e607b5b409b236f7d5d2ef1_thumb" alt=""></mip-img> </div><div class="info pure-u-5-6"><h2 class="title">局域网技术研究网络协议研究</h2><p>局域网技术研究-网络协议研究局域网技术研究-网络协议研究摘要21世纪以来，伴随着计算机技术，互联网通讯技术，各种治办信息系统的发展，以当代科技信息技术，与建立在企业治理科学为根基的系统也发挥着越来越不可替代的作用。在企业管理中，在计算机网络的经济大环境下的其中一个部门可能会直接影响该企业的信息化的创新力，通过对网络环境的布置，可以</p><p class="extra"><span>平***苏 </span>1年前上传<span class=" pull-right">185 <i aria-hidden="true" class="fa fa-eye"></i> 0 <i aria-hidden="true" class="fa fa-thumbs-o-up"></i></span></p></div></a> <a class="pure-g ui-item" data-type="mip" href="/doc/4844253017948559077.html" title="基于网络流量特征的木马检测技术研究"><div class=" pure-u-1-6 cover"><mip-img src="https://sdoc.xiangdang.net/image/6d9261b74bbb532e12ce384272cf2cbb_thumb" alt=""></mip-img> </div><div class="info pure-u-5-6"><h2 class="title">基于网络流量特征的木马检测技术研究</h2><p>文章首先介绍了当前网络环境下木马的特征、工作原理，比较分析了常见的木马检测方法、优缺点及其面临的挑战，然后从木马网络通信的本质特征出发，分析了基于网络流量特征的未知木马检测技术，提出了一种基于网络流量特征分析的木马检测模型。</p><p class="extra"><span>倩***7 </span>6年前上传<span class=" pull-right">2401 <i aria-hidden="true" class="fa fa-eye"></i> 0 <i aria-hidden="true" class="fa fa-thumbs-o-up"></i></span></p></div></a> <a class="pure-g ui-item" data-type="mip" href="/doc/5883820828311928565.html" title="网络安全主题班会记录"><div class=" pure-u-1-6 cover"><mip-img src="https://sdoc.xiangdang.net/image/0b6685ff2cc902e5e057c03eee5ca2be_thumb" alt=""></mip-img> </div><div class="info pure-u-5-6"><h2 class="title">网络安全主题班会记录</h2><p>网络安全主题班会记录网络安全主题班会记录1活动背景：随着社会的发展，电脑网络越来越普遍。一些未成年人因接触互联网而沉溺于网络虚拟世界，脱离现实，上网成瘾，身心受损，引发网络犯罪的问题也越来越突出。这不得不引起我们的重视与思考。如何引导青少年正确上网已成为当前学校德育教育的重要内容。活动目的：1、使学生明白“沉溺网络“的危害性，让学生通过参与，从思想上彻底认识到远离网络游戏等不良内容的必</p><p class="extra"><span>M***7 </span>6个月前上传<span class=" pull-right">207 <i aria-hidden="true" class="fa fa-eye"></i> 0 <i aria-hidden="true" class="fa fa-thumbs-o-up"></i></span></p></div></a> <a class="pure-g ui-item" data-type="mip" href="/doc/5129495515372862253.html" title="分布式网络爬虫的设计与实现——分布式算法研究和系统架构设计"><div class=" pure-u-1-6 cover"><mip-img src="https://sdoc.xiangdang.net/image/c081b476859a657514ac5f8c9ea73754_thumb" alt=""></mip-img> </div><div class="info pure-u-5-6"><h2 class="title">分布式网络爬虫的设计与实现——分布式算法研究和系统架构设计</h2><p> 毕业论文分布式网络爬虫的设计与实现 ——分布式算法研究和系统架构设计摘　要随着网络技术的发展，Web上的信息海量增加，人们对信息的需求也不断加大，使得专门负责Web信息采集的网络爬虫技术面临着</p><p class="extra"><span>山***1 </span>5年前上传<span class=" pull-right">1087 <i aria-hidden="true" class="fa fa-eye"></i> 0 <i aria-hidden="true" class="fa fa-thumbs-o-up"></i></span></p></div></a> <a class="pure-g ui-item" data-type="mip" href="/doc/4798230120552823747.html" title="出口创汇型提质增效及产业升级关键技术研究与示范项目绩效评价报告"><div class=" pure-u-1-6 cover"><mip-img src="https://sdoc.xiangdang.net/image/fb8b84e91f1e7802d988785a30af68c6_thumb" alt=""></mip-img> </div><div class="info pure-u-5-6"><h2 class="title">出口创汇型提质增效及产业升级关键技术研究与示范项目绩效评价报告</h2><p>出口创汇型鸭梨提质增效及产业升级关键技术研究与示范项目绩效评价报告一、项目概况（一）项目背景资料。 “出口创汇型鸭梨提质增效及产业升级关键技术研究与示范”项目针对鸭梨生产中存在的问题，研究鸭梨及引进梨新品种相配套的提质增效关键技术，建成高产优质高效的精品梨展示园，同时创建大型出口创汇基地。研究制定与国际接轨的无公害果品的质量标准，以扩大梨出口创汇的优势为主要目标。 1、主</p><p class="extra"><span>海***科 </span>10年前上传<span class=" pull-right">9054 <i aria-hidden="true" class="fa fa-eye"></i> 0 <i aria-hidden="true" class="fa fa-thumbs-o-up"></i></span></p></div></a> <a class="pure-g ui-item" data-type="mip" href="/doc/4798232777504564313.html" title="黑木耳液态深层发酵及生物活性物质分离提取的关键技术研究"><div class=" pure-u-1-6 cover"><mip-img src="https://sdoc.xiangdang.net/image/017f611b0a7931d94b8839a184983422_thumb" alt=""></mip-img> </div><div class="info pure-u-5-6"><h2 class="title">黑木耳液态深层发酵及生物活性物质分离提取的关键技术研究</h2><p> 黑木耳液体深层发酵及生物活性物质分离提的关键技术研究项目简介一、项目名称、承担单位项目名称;黑木耳液体深层发酵及生物活性物质分离提取的关键承担单位:**华鑫菌业责任有限公司依托单位:**农业大学 **华鑫菌业有限责任公司是一家股份制企业，注册资金1000万元，总资产12300万元。公司主要从事食用菌生产及食用菌深加工，现主要经营范围为黑木耳生产加工、黑木耳营养</p><p class="extra"><span>1***荟 </span>10年前上传<span class=" pull-right">7418 <i aria-hidden="true" class="fa fa-eye"></i> 0 <i aria-hidden="true" class="fa fa-thumbs-o-up"></i></span></p></div></a> <a class="pure-g ui-item" data-type="mip" href="/doc/5043389905635877379.html" title="白茶引种栽培及关键技术研究课题申报书及茶叶基地实施方案"><div class=" pure-u-1-6 cover"><mip-img src="https://sdoc.xiangdang.net/image/067344b8c783abe150008c386fe2308f_thumb" alt=""></mip-img> </div><div class="info pure-u-5-6"><h2 class="title">白茶引种栽培及关键技术研究课题申报书及茶叶基地实施方案</h2><p>**是中国六大茶类之一，为福建特产，主要产区在福鼎、政和、松溪、建阳等地。基本工艺包括萎凋、烘焙（或阴干）、拣剔、复火等工序。萎凋是形成**品质的关键工序。**具有外形芽毫完整,满身披毫，毫香清鲜，汤色黄绿清澈，滋味清淡回甘的的品质特点。属轻微发酵茶，是我国茶类中的特殊珍品。</p><p class="extra"><span>l***u </span>5年前上传<span class=" pull-right">1004 <i aria-hidden="true" class="fa fa-eye"></i> 0 <i aria-hidden="true" class="fa fa-thumbs-o-up"></i></span></p></div></a> <a class="pure-g ui-item" data-type="mip" href="/doc/5513634763030638019.html" title="项目协调技术研究"><div class=" pure-u-1-6 cover"><mip-img src="https://sdoc.xiangdang.net/image/1bd89f711806b2921d91fdcf78720e63_thumb" alt=""></mip-img> </div><div class="info pure-u-5-6"><h2 class="title">项目协调技术研究</h2><p>项目协调技术研究　　摘要:文章讨论了项目协调的作用,构筑了项目协调系统的基本框架,分析了影响协调工作的因素,项目协调系统由协调的主体、项目协调技术、被协调对象等组成,并通过一定的组织形式和项目指挥方式实现。赋予项目协调工作新的内涵,提出协调技术主要包括通报技术、沟通技术、协商技术、谈判技术和冲突处理技术五个方面,　　关键词:协调技术;通报技术;沟通技术;协商技术;谈判技术;冲突处理技术</p><p class="extra"><span>h***t </span>12年前上传<span class=" pull-right">582 <i aria-hidden="true" class="fa fa-eye"></i> 0 <i aria-hidden="true" class="fa fa-thumbs-o-up"></i></span></p></div></a> <a class="pure-g ui-item" data-type="mip" href="/doc/4798235240298440973.html" title="转基因技术研究进展"><div class=" pure-u-1-6 cover"><mip-img src="https://sdoc.xiangdang.net/image/f88ae9a869cdc23ed82ab4d46d04f990_thumb" alt=""></mip-img> </div><div class="info pure-u-5-6"><h2 class="title">转基因技术研究进展</h2><p> 转基因技术研究进展 [摘要] 转基因技术可以认为是在一定程度上通过科学技术手段让其他动物、植物朝着人类有利方向发展的技术。该项技术在美国问世至今，正以日新月异的速度迅猛发展。但由于转基因生物及其产品是否存在潜在危险尚无定论，故此项技术及其产品的安全性成为全球的热点问题，并引起世界各国政府和</p><p class="extra"><span>c***c </span>9年前上传<span class=" pull-right">8651 <i aria-hidden="true" class="fa fa-eye"></i> 0 <i aria-hidden="true" class="fa fa-thumbs-o-up"></i></span></p></div></a> <a class="pure-g ui-item" data-type="mip" href="/doc/4798239338663806903.html" title="＊＊＊＊工业技术研究院"><div class=" pure-u-1-6 cover"><mip-img src="https://sdoc.xiangdang.net/image/85ee8dc6a04575237e069681d9ca4dd0_thumb" alt=""></mip-img> </div><div class="info pure-u-5-6"><h2 class="title">＊＊＊＊工业技术研究院</h2><p>西安赛宝工业技术研究院简介西安赛宝工业技术研究院（简称西安赛宝）是工业和信息化部电子第五研究所（中国赛宝实验室）下属全资子公司。2016年5月13日，电子五所与**省西安市户县人民政府签订的“关于设立西安赛宝工业技术研究院的合作协议”作为西安市重点打造的合同项目之一，推介在“新平台·新发展”2016丝博会暨第20届西洽会·西安国际投资促进交流会暨重点项目签约仪式上进行。协议的签订标志着中国赛</p><p class="extra"><span>h***n </span>6年前上传<span class=" pull-right">2044 <i aria-hidden="true" class="fa fa-eye"></i> 0 <i aria-hidden="true" class="fa fa-thumbs-o-up"></i></span></p></div></a> <a class="pure-g ui-item" data-type="mip" href="/doc/5720208034694904218.html" title="基于增量式爬虫的搜索引擎系统的设计"><div class=" pure-u-1-6 cover"><mip-img src="https://sdoc.xiangdang.net/image/6fa2dd3f52b63988af7b60d0626a512c_thumb" alt=""></mip-img> </div><div class="info pure-u-5-6"><h2 class="title">基于增量式爬虫的搜索引擎系统的设计</h2><p>随着社会的不断发展，信息增长的也越来越快，大量的数据涌现在我们面前，对于这些数据，我们对信息的查找和提取也会更加困难。如何更快速、更精准的找到我们所需要的信息，获取到有用的信息成为了很重要的一个技术。</p><p class="extra"><span>爱***享 </span>3年前上传<span class=" pull-right">491 <i aria-hidden="true" class="fa fa-eye"></i> 0 <i aria-hidden="true" class="fa fa-thumbs-o-up"></i></span></p></div></a> <a class="pure-g ui-item" data-type="mip" href="/doc/5290827059428025330.html" title="突出四个关键、推动主题教育走深走实"><div class=" pure-u-1-6 cover"><mip-img src="https://sdoc.xiangdang.net/image/a2454ad383c95274c85aef594023fc1f_thumb" alt=""></mip-img> </div><div class="info pure-u-5-6"><h2 class="title">突出四个关键、推动主题教育走深走实</h2><p>我局立足桂中治旱工程建设实际，以主题教育为抓手，坚持问题导向、责任导向，突出四个关键，切实通过学习教育，筑牢忠诚根基；通过调查研究，补齐工作短板；通过检视问题，改进工作作风；通过整改落实，推动工作提质，始终与市委同向同行，做到了谋实事、出实招、做实功、求实效，取得了良好的成效。</p><p class="extra"><span>噶***玛 </span>4年前上传<span class=" pull-right">1006 <i aria-hidden="true" class="fa fa-eye"></i> 0 <i aria-hidden="true" class="fa fa-thumbs-o-up"></i></span></p></div></a> <a class="pure-g ui-item" data-type="mip" href="/doc/5513637557954877244.html" title="网络情缘主题婚礼（上部分）"><div class=" pure-u-1-6 cover"><mip-img src="https://sdoc.xiangdang.net/image/228b328e45504597ae8b8d4ef12428e4_thumb" alt=""></mip-img> </div><div class="info pure-u-5-6"><h2 class="title">网络情缘主题婚礼（上部分）</h2><p>进入了E时代..很多新人都从网上认识,结婚..做一个策划,大家指点. 婚礼以舞台剧的形式:男）夜深了，我听你手指尖流出的浪漫，我的心也变成了琴弦。我在屏幕的这端，你在屏幕的那端。你我近在咫尺，近到可以触摸到你的呼吸。我们又远隔天涯，远到难以跨越万水千山。（女）爱情的影子无声无息地悄然而来，你那深情的眼睛透过屏幕，久久地注视着我，我的心屏上已经反复放映你的身影，我体会着你的真诚、你的真情</p><p class="extra"><span>千***杨 </span>10年前上传<span class=" pull-right">597 <i aria-hidden="true" class="fa fa-eye"></i> 0 <i aria-hidden="true" class="fa fa-thumbs-o-up"></i></span></p></div></a> <a class="pure-g ui-item" data-type="mip" href="/doc/4798228693998412053.html" title="教育方式——主题网络活动体会"><div class=" pure-u-1-6 cover"><mip-img src="https://sdoc.xiangdang.net/image/f976dade288186435f3ad70e2cc521f5_thumb" alt=""></mip-img> </div><div class="info pure-u-5-6"><h2 class="title">教育方式——主题网络活动体会</h2><p>主题------“纸”活动小结从后现代主义的观点出发，学习不再是孤零零的认知过程，而是一种合作、交往的活动。儿童在活动中与同伴和成人共建知识，理解世界。学习不再是儿童获得预先知道的结果，儿童也不是空的容器或知识的复制者。儿童是积极的，儿童拥有的理论和观念不仅应该被认真倾听，而且应该被仔细研究，在合作的时候还应该给予质疑和挑战。因此，教育者必须激发儿童活动的积极性，并为儿童提供与他人交流自</p><p class="extra"><span>檬***2 </span>11年前上传<span class=" pull-right">9508 <i aria-hidden="true" class="fa fa-eye"></i> 0 <i aria-hidden="true" class="fa fa-thumbs-o-up"></i></span></p></div></a> <a class="pure-g ui-item" data-type="mip" href="/doc/4884555963641660062.html" title="关键成功要素与相应的关键业绩指标："><div class=" pure-u-1-6 cover"><mip-img src="https://sdoc.xiangdang.net/image/8f5acae969582641500ca75cdcd77585_thumb" alt=""></mip-img> </div><div class="info pure-u-5-6"><h2 class="title">关键成功要素与相应的关键业绩指标：</h2><p>关键成功要素与相应的关键业绩指标：关键成功要素（CSF）关键业绩指标（KPI）获取新客户每月获得新客户的数量通过新客户实现销售额占总销售额的百分比重复购买的客户重复购买的客户实现的销售额占总销售额的百分比客户满意度客户抱怨的数目通过老客户介绍获得的新客户数量老客户介绍的新客户实现销售额的百分比低交付成本每一元销售额的交付成本每吨的交付成本 </p><p class="extra"><span>y***4 </span>13年前上传<span class=" pull-right">20558 <i aria-hidden="true" class="fa fa-eye"></i> 0 <i aria-hidden="true" class="fa fa-thumbs-o-up"></i></span></p></div></a> <a class="pure-g ui-item" data-type="mip" href="/doc/5513634337993100234.html" title="关键网络技术转变电信运营业务模式-通信解决方案"><div class=" pure-u-1-6 cover"><mip-img src="https://sdoc.xiangdang.net/image/9e125afa17740321f989023ef9b36053_thumb" alt=""></mip-img> </div><div class="info pure-u-5-6"><h2 class="title">关键网络技术转变电信运营业务模式-通信解决方案</h2><p>关键网络技术转变电信运营业务模式-通信解决方案　　在电信服务供应商眼中，这个世界的变化实在太快。随着竞争的不断扩大以及网络力量的提升，昔日那些令供应商蓬勃发展的服务与电信业务模式在今天却需要他们三思而后行。幸运的是，他们的网络基础架构即便在今日极为苛求、竞争激烈的市场中依然是一条十分重要的分水岭，并可应用于除目前盛行的数据管道(BItpipe)模式以外的许多增值业务模式。有了适当的技术手段，</p><p class="extra"><span>s***a </span>12年前上传<span class=" pull-right">543 <i aria-hidden="true" class="fa fa-eye"></i> 0 <i aria-hidden="true" class="fa fa-thumbs-o-up"></i></span></p></div></a> <a class="pure-g ui-item" data-type="mip" href="/doc/5989621025948428199.html" title="公司关键信息基础设施网络安全检查自查报告"><div class=" pure-u-1-6 cover"><mip-img src="https://sdoc.xiangdang.net/image/34f00a262b2698def3aee6392a84bbe4_thumb" alt=""></mip-img> </div><div class="info pure-u-5-6"><h2 class="title">公司关键信息基础设施网络安全检查自查报告</h2><p>为保证我公司系统网络与信息安全，进一步加强网络管理工作，有效地防范蓄意攻击、破坏网络信息系统及传播、粘贴非法信息等突发紧急事件的发生</p><p class="extra"><span>落***人 </span>2年前上传<span class=" pull-right">519 <i aria-hidden="true" class="fa fa-eye"></i> 0 <i aria-hidden="true" class="fa fa-thumbs-o-up"></i></span></p></div></a> <a class="pure-g ui-item" data-type="mip" href="/doc/5746584376181723672.html" title="核电厂概率安全评价（PSA）技术研究"><div class=" pure-u-1-6 cover"><mip-img src="https://sdoc.xiangdang.net/image/6f373ba37ba6ca99ed5452a22bbcc3ea_thumb" alt=""></mip-img> </div><div class="info pure-u-5-6"><h2 class="title">核电厂概率安全评价（PSA）技术研究</h2><p>核电厂概率安全评价（PSA）技术研究　　核电被称为技术设备、人的群体和组织三类元素的大型经济实体，属科技密集型产业。对于核电厂而言，安全是核电存在和发展的基础。在核电厂以往的系统安全分析中，难以确定出具体的安全风险目标，在风险和费用之间的权衡存在困难，更不易对事故发展的潜在原因及事故发展的可能进程进行分析研究。基于此目的，概率安全评价（PSA：Probability Safety A</p><p class="extra"><span>和***6 </span>3年前上传<span class=" pull-right">504 <i aria-hidden="true" class="fa fa-eye"></i> 0 <i aria-hidden="true" class="fa fa-thumbs-o-up"></i></span></p></div></a> <a class="pure-g ui-item" data-type="mip" href="/doc/4798228259677619193.html" title="浅谈深基坑支护技术研究"><div class=" pure-u-1-6 cover"><mip-img src="https://sdoc.xiangdang.net/image/38d56ad03595a4c6ada37394c2f912ad_thumb" alt=""></mip-img> </div><div class="info pure-u-5-6"><h2 class="title">浅谈深基坑支护技术研究</h2><p>浅谈深基坑支护技术研究朱德华 **锦华建工集团有限公司摘要：伴随着我国国民经济日益蓬勃发展，建筑向着大型化、高层化快速发展，大量大型建筑、高层建筑拔地而起，日益增多。众所周知，任何建筑都必须有一个好的基础，对大型高层、超高层建筑来讲，这点尤为重要。于是深基坑的施工安全技术的重要性日益凸显。本文主要阐述在深基坑施工中支护体施工的相关内容，说明支护体施工特点和相应技术防护措施。关键</p><p class="extra"><span>y***l </span>11年前上传<span class=" pull-right">10532 <i aria-hidden="true" class="fa fa-eye"></i> 0 <i aria-hidden="true" class="fa fa-thumbs-o-up"></i></span></p></div></a> <a class="pure-g ui-item" data-type="mip" href="/doc/4798226647081019801.html" title="智能电力系统调度技术研究"><div class=" pure-u-1-6 cover"><mip-img src="https://sdoc.xiangdang.net/image/4319b425e0f8b73cb41c528c9312f2a3_thumb" alt=""></mip-img> </div><div class="info pure-u-5-6"><h2 class="title">智能电力系统调度技术研究</h2><p>智能电力系统调度技术探究摘要：随着我国经济的不断向前发展，电网的广泛普及，智能电网的建设也成为了我们工作中的重点。然而在智能电网中，调度技术更是其中的一个重点及难点，所以我们需要对其进行详细的分析和研究。因此笔者根据个人多年来相关行业的工作经验并结合我国智能电力系统的调度技术的实际情况，先对智能电力系统进行概述，继而对智能电力调度系统技术进行仔细分析和研究，希望可以起到抛砖引玉的作用，</p><p class="extra"><span>w***7 </span>11年前上传<span class=" pull-right">11259 <i aria-hidden="true" class="fa fa-eye"></i> 0 <i aria-hidden="true" class="fa fa-thumbs-o-up"></i></span></p></div></a> </div> </section> </section> <footer class="copy center ut-pd20">© 2006-2021 香当网 <br><p class="gray"><a target="_blank" href="http://www.beian.gov.cn/portal/registerSystemInfo?recordcode=33018302001162"> 浙公网安备 33018302001162号</a><br><a target="_blank" href="https://beian.miit.gov.cn">浙ICP备09019653号-34</a></p><script>var _hmt = _hmt || [];(function() {var hm = document.createElement("script");hm.src = "https://hm.baidu.com/hm.js?6600a1cc9ed25ba2bcceeda1f2a917f9";var s = document.getElementsByTagName("script")[0];s.parentNode.insertBefore(hm, s);})();</script></footer> <mip-fixed type="gototop"><mip-gototop threshold='300'><i class="fa fa-arrow-up" ></i></mip-gototop></mip-fixed>  </body> </html>

热门搜索

主题网络爬虫关键技术研究

爱***享

贡献于2021-08-20