电子商务A第08讲补充课件

上传人:无*** 文档编号:230678575 上传时间:2023-08-27 格式:PPT 页数:30 大小:243KB
收藏 版权申诉 举报 下载
电子商务A第08讲补充课件_第1页
第1页 / 共30页
电子商务A第08讲补充课件_第2页
第2页 / 共30页
电子商务A第08讲补充课件_第3页
第3页 / 共30页
资源描述:

《电子商务A第08讲补充课件》由会员分享,可在线阅读,更多相关《电子商务A第08讲补充课件(30页珍藏版)》请在装配图网上搜索。

1、Electronic BusinessElectronic BusinessElectronic BusinessElectronic Business电子商务电子商务电子商务电子商务 第第0808讲讲 北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院电电 子子 商商 务务张文新张文新 副教授副教授副教授副教授电话:电话:Email:Email:1 1Electronic BusinessElectronic BusinessElectronic BusinessElectronic Business电子商务电子商务电子商务电子商务 第第0808

2、讲讲 北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院课课程程安安排排讲授(讲授(36学时,共学时,共17讲)讲)第第1讲讲:绪论绪论第第10讲讲:电子商务物流规划技术电子商务物流规划技术第第2讲讲:电子商务的概念与结构电子商务的概念与结构第第11讲讲:物流信息系统集成技术物流信息系统集成技术第第3讲讲:电子商务战略电子商务战略第第12讲讲:物流配送优化调度技术物流配送优化调度技术第第4讲讲:电子商务系统设计电子商务系统设计第第13讲讲:电子商务资金流电子商务资金流第第5讲讲:电子商务网站设计电子商务网站设计第第14讲讲:电子支付技术电子支付技术

3、第第6讲讲:电子商务交易流程电子商务交易流程第第15讲讲:电子支付平台工具电子支付平台工具第第7讲讲:电子商务商品展示技术电子商务商品展示技术第第16讲讲:电子支付安全技术电子支付安全技术第第第第8 8 8 8讲讲讲讲:电子商务搜索引擎技术电子商务搜索引擎技术电子商务搜索引擎技术电子商务搜索引擎技术第第17讲讲:电子商务法律法规电子商务法律法规第第9讲讲:电子商务商品推荐技术电子商务商品推荐技术考试:最后一次课考试:最后一次课2 2Electronic BusinessElectronic BusinessElectronic BusinessElectronic Business电子商务电子

4、商务电子商务电子商务 第第0808讲讲 北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院第第8 8讲讲电子商务搜索引擎技术电子商务搜索引擎技术3 3Electronic BusinessElectronic BusinessElectronic BusinessElectronic Business电子商务电子商务电子商务电子商务 第第0808讲讲 北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院电子商务搜索引擎技术电子商务搜索引擎技术p搜索引擎的关键技术搜索引擎的关键技术n网络蜘蛛(网络蜘蛛(Sp

5、ider,Robot,Crawler)n网页结构化信息抽取网页结构化信息抽取n中文分词中文分词n搜索结果排序搜索结果排序4 4Electronic BusinessElectronic BusinessElectronic BusinessElectronic Business电子商务电子商务电子商务电子商务 第第0808讲讲 北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院电子商务搜索引擎技术电子商务搜索引擎技术p网络蜘蛛(网络蜘蛛(Spider,Robot,Crawler)n对对URL链接进行遍历链接进行遍历n基本数据结构基本数据结构一个待扩

6、展的一个待扩展的URL表表一个已经访问过的一个已经访问过的URL地址表地址表TODOTODO表表VisitedVisited表表初始初始URL地址地址解析解析URL新解析出的新解析出的URL图:网络蜘蛛基本数据结构图图:网络蜘蛛基本数据结构图5 5Electronic BusinessElectronic BusinessElectronic BusinessElectronic Business电子商务电子商务电子商务电子商务 第第0808讲讲 北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院电子商务搜索引擎技术电子商务搜索引擎技术p网络蜘蛛(

7、网络蜘蛛(Spider,Robot,Crawler)n遍历遍历URL地址地址遍历的策略遍历的策略广度优先广度优先深度优先深度优先A AB BC CD DGGE EF FHHI IAB,C,D,E,F H,G IAF GE H I6 6Electronic BusinessElectronic BusinessElectronic BusinessElectronic Business电子商务电子商务电子商务电子商务 第第0808讲讲 北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院电子商务搜索引擎技术电子商务搜索引擎技术p搜索引擎的关键技术搜索引

8、擎的关键技术n提取文档中的文本内容(网页结构化信息抽取)提取文档中的文本内容(网页结构化信息抽取)HTML文件中提取文本文件中提取文本 识别网页的编码识别网页的编码识别网页的编码识别网页的编码STEP-1:从从Web服务器返回的服务器返回的contenttype中提取编码;中提取编码;STEP-2:从网页的从网页的Meta信息中识别字符编码;信息中识别字符编码;STEP-3:从返回流的二进制格式判断,确定网页语言。从返回流的二进制格式判断,确定网页语言。对对对对HTMLHTMLHTMLHTML文件进行解析(识别三类节点)文件进行解析(识别三类节点)文件进行解析(识别三类节点)文件进行解析(识别

9、三类节点)RemarkNode(注释)(注释)TagNode(标签)(标签)TextNode(文本)(文本)7 7Electronic BusinessElectronic BusinessElectronic BusinessElectronic Business电子商务电子商务电子商务电子商务 第第0808讲讲 北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院电子商务搜索引擎技术电子商务搜索引擎技术n提取文档中的文本内容(网页结构化信息抽取)提取文档中的文本内容(网页结构化信息抽取)HTML文件中提取文本(续)文件中提取文本(续)结构化信息提

10、取结构化信息提取DOM(文档对象模型)结构(文档对象模型)结构HTML扫描器扫描器例如:例如:Node.getAttributes().getNamedItem(“src”)参考参考NekoHTML()()网页去噪网页去噪网页结构相似度计算网页结构相似度计算8 8Electronic BusinessElectronic BusinessElectronic BusinessElectronic Business电子商务电子商务电子商务电子商务 第第0808讲讲 北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院电子商务搜索引擎技术电子商务搜索引擎

11、技术pDOM树树 BODYBODYTableTableIMGIMGTableTableBODYbgcolor=WHITEwidth=800 width=800 图:图:DOM树树9 9Electronic BusinessElectronic BusinessElectronic BusinessElectronic Business电子商务电子商务电子商务电子商务 第第0808讲讲 北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院电子商务搜索引擎技术电子商务搜索引擎技术n提取文档中的文本内容(网页结构化信息抽取)提取文档中的文本内容(网页结构化

12、信息抽取)HTML文件中提取文本(续)文件中提取文本(续)网页结构相似度计算网页结构相似度计算自动提取结构化信息的关键是:自动提取结构化信息的关键是:“从同样类型的实例中发从同样类型的实例中发现编码模板现编码模板”。计算两个网页的结构相似度计算两个网页的结构相似度方法一:从方法一:从HTML编码字符串检测重复模式,检测方法有:编码字符串检测重复模式,检测方法有:字符串编辑距离和字符串编辑距离和树编辑距离树编辑距离请参阅相关文献及编程资源请参阅相关文献及编程资源1010Electronic BusinessElectronic BusinessElectronic BusinessElectro

13、nic Business电子商务电子商务电子商务电子商务 第第0808讲讲 北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院电子商务搜索引擎技术电子商务搜索引擎技术nHTML文件中提取文本(续)文件中提取文本(续)正文提取正文提取STEP-1:根据正文特征进行网页去噪根据正文特征进行网页去噪正文详细页面的特征:文字较多,有明显段落,标点符号正文详细页面的特征:文字较多,有明显段落,标点符号较多,较多,URL较长,链接较少;较长,链接较少;计算节点的计算节点的“链接文字比链接文字比”=“节点下链接数节点下链接数”/“节点下节点下文字数文字数”删除删

14、除“链接文字比链接文字比”大于某个阈值的节点;大于某个阈值的节点;STEP-2:网页链接中锚点文本(网页标题)与网页正文关系分网页链接中锚点文本(网页标题)与网页正文关系分析析STEP-3:自动模板自动模板1111Electronic BusinessElectronic BusinessElectronic BusinessElectronic Business电子商务电子商务电子商务电子商务 第第0808讲讲 北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院电子商务搜索引擎技术电子商务搜索引擎技术p搜索引擎的关键技术搜索引擎的关键技术中文分词

15、中文分词两类方法:两类方法:“机械匹配法机械匹配法”和和“统计法统计法”机械法:机械法:最大匹配法最大匹配法利用正向或反向或双向最大匹配的方法来分词;利用正向或反向或双向最大匹配的方法来分词;借助标准的词典借助标准的词典搜索词典搜索词典统计法:统计法:最大概率分词法最大概率分词法一个待切分的汉字串可能包含多种分词结果一个待切分的汉字串可能包含多种分词结果将其中概率最大的那个作为该字符串的分词结果将其中概率最大的那个作为该字符串的分词结果1212Electronic BusinessElectronic BusinessElectronic BusinessElectronic Business

16、电子商务电子商务电子商务电子商务 第第0808讲讲 北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院电子商务搜索引擎技术电子商务搜索引擎技术p中文分词中文分词n机械法:机械法:最大匹配法最大匹配法例:例:“东北京西东北京西”匹配算法匹配算法数字搜索树数字搜索树Trie(Trie(三叉搜索树三叉搜索树)1313Electronic BusinessElectronic BusinessElectronic BusinessElectronic Business电子商务电子商务电子商务电子商务 第第0808讲讲 北京科技大学经济管理学院北京科技大学经

17、济管理学院北京科技大学经济管理学院北京科技大学经济管理学院电子商务搜索引擎技术电子商务搜索引擎技术p数字搜索树数字搜索树例:例:“东北京西东北京西”搜索最大高度是词典中最长词的长度;搜索最大高度是词典中最长词的长度;每个节点都需要消耗很多内存;每个节点都需要消耗很多内存;东东东东西西西西方方方方北北北北红红红红京京京京盟盟盟盟西西西西1414Electronic BusinessElectronic BusinessElectronic BusinessElectronic Business电子商务电子商务电子商务电子商务 第第0808讲讲 北京科技大学经济管理学院北京科技大学经济管理学院北京

18、科技大学经济管理学院北京科技大学经济管理学院电子商务搜索引擎技术电子商务搜索引擎技术pTrieTrie树树Trie树,又称字典树,单词查找树。树,又称字典树,单词查找树。它来源于它来源于retrieval(检索)中取中间四个字符构成;(检索)中取中间四个字符构成;用于存储大量的字符串以便支持快速模式匹配。主要应用用于存储大量的字符串以便支持快速模式匹配。主要应用在信息检索领域。在信息检索领域。1515Electronic BusinessElectronic BusinessElectronic BusinessElectronic Business电子商务电子商务电子商务电子商务 第第080

19、8讲讲 北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院电子商务搜索引擎技术电子商务搜索引擎技术pTrieTrie树树n标准标准 Trie树的结构树的结构:所有含有公共前缀的字符串将挂在树中同一个结点下。所有含有公共前缀的字符串将挂在树中同一个结点下。实际上实际上trie简明的存储了存在于串集合中的所有公共前缀。简明的存储了存在于串集合中的所有公共前缀。n假如有这样一个字符串集合假如有这样一个字符串集合Xbear,bell,bid,bull,buy,sell,stock,stop。它的标它的标准准Trie树如下图:树如下图:1616Electro

20、nic BusinessElectronic BusinessElectronic BusinessElectronic Business电子商务电子商务电子商务电子商务 第第0808讲讲 北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院电子商务搜索引擎技术电子商务搜索引擎技术p标准标准Trie树的查找树的查找n对于英文单词的查找,我们完全可以在内部结点中建立26个元素组成的指针数组。n查找过程:假如我们要在上面那棵Trie中查找字符串bull(b-u-l-l)。(1)在在root结点中查找第结点中查找第(b-a=1)号子指针,发现该指针不为号子

21、指针,发现该指针不为空,则定位到第空,则定位到第1号子结点处号子结点处b结点。结点。(2)在在b结点中查找第结点中查找第(u-a=20)号子指针,发现该指针不为空,号子指针,发现该指针不为空,则定位到第则定位到第20号子结点处号子结点处u结点。结点。(3).一直查找到叶子结点出现特殊字符一直查找到叶子结点出现特殊字符$位置,表示找到了位置,表示找到了bull字符串字符串n如果在查找过程中终止于内部结点,则表示没有找到待查找字符串。1717Electronic BusinessElectronic BusinessElectronic BusinessElectronic Business电子商

22、务电子商务电子商务电子商务 第第0808讲讲 北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院电子商务搜索引擎技术电子商务搜索引擎技术p中文词语的标准中文词语的标准Trie树树n由于中文的字远比英文的26个字母多的多。因此对于trie树的内部结点,不可能用一个26的数组来存储指针。如果每个结点都开辟几万个中国字的指针空间。不仅内存消耗过大,就连磁盘也消耗很大。n一般可以采取这样种措施:(1)以词语中相同的第一个字为根组成一棵树。这样的话,一个中以词语中相同的第一个字为根组成一棵树。这样的话,一个中文词汇的集合就可以构成一片文词汇的集合就可以构成一

23、片Trie森林。这篇森林都存储在磁盘上。森林。这篇森林都存储在磁盘上。森林的森林的root中的字和中的字和root所在磁盘的位置都记录在一张以所在磁盘的位置都记录在一张以Unicode码值排序的有序字表中。字表可以存放在内存里。码值排序的有序字表中。字表可以存放在内存里。(2)内部结点的指针用可变长数组存储。内部结点的指针用可变长数组存储。1818Electronic BusinessElectronic BusinessElectronic BusinessElectronic Business电子商务电子商务电子商务电子商务 第第0808讲讲 北京科技大学经济管理学院北京科技大学经济管理学

24、院北京科技大学经济管理学院北京科技大学经济管理学院电子商务搜索引擎技术电子商务搜索引擎技术p中文词语的标准中文词语的标准Trie树树n特点:由于中文词语很少操作由于中文词语很少操作4个字的,因此个字的,因此Trie树的高度不长。树的高度不长。查找的时间主要耗费在内部结点指针的查找。查找的时间主要耗费在内部结点指针的查找。将指向字的指针按照字的将指向字的指针按照字的Unicode码值排序,然后加载进内存以后码值排序,然后加载进内存以后通过二分查找能够提高效率。通过二分查找能够提高效率。1919Electronic BusinessElectronic BusinessElectronic Bus

25、inessElectronic Business电子商务电子商务电子商务电子商务 第第0808讲讲 北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院电子商务搜索引擎技术电子商务搜索引擎技术p中文词语的标准中文词语的标准Trie树树n标准标准Trie树的应用和优缺点树的应用和优缺点(1)全字匹配:确定待查字串是否与集合的一个单词完全字匹配:确定待查字串是否与集合的一个单词完全匹配。全匹配。(2)前缀匹配:查找集合中以匹配字为前缀的所有串。前缀匹配:查找集合中以匹配字为前缀的所有串。2020Electronic BusinessElectronic

26、BusinessElectronic BusinessElectronic Business电子商务电子商务电子商务电子商务 第第0808讲讲 北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院电子商务搜索引擎技术电子商务搜索引擎技术p搜索引擎的关键技术搜索引擎的关键技术中文分词中文分词两类方法:两类方法:“机械匹配法机械匹配法”和和“统计法统计法”机械法:机械法:最大匹配法最大匹配法统计法:统计法:最大概率分词法最大概率分词法一个待切分的汉字串可能包含多种分词结果一个待切分的汉字串可能包含多种分词结果将其中概率最大的那个作为该字符串的分词结果将其

27、中概率最大的那个作为该字符串的分词结果2121Electronic BusinessElectronic BusinessElectronic BusinessElectronic Business电子商务电子商务电子商务电子商务 第第0808讲讲 北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院电子商务搜索引擎技术电子商务搜索引擎技术p搜索引擎的关键技术搜索引擎的关键技术中文分词中文分词统计法:统计法:最大概率分词法最大概率分词法有有意意见见分分岐岐(1 1)有有/意见意见/分歧分歧(2 2)有意有意/见见/分歧分歧2222Electronic

28、 BusinessElectronic BusinessElectronic BusinessElectronic Business电子商务电子商务电子商务电子商务 第第0808讲讲 北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院电子商务搜索引擎技术电子商务搜索引擎技术p搜索引擎的关键技术搜索引擎的关键技术中文分词中文分词统计法:统计法:最大概率分词法最大概率分词法有有意意见见分分岐岐W W1 1:有有/意见意见/分歧分歧W W2 2:有意有意/见见/分歧分歧S:S:有意见分歧有意见分歧分别计算:分别计算:P(WP(W1 1S)S)和和P(WP

29、(W2 2S)S)2323Electronic BusinessElectronic BusinessElectronic BusinessElectronic Business电子商务电子商务电子商务电子商务 第第0808讲讲 北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院电子商务搜索引擎技术电子商务搜索引擎技术p搜索引擎的关键技术搜索引擎的关键技术中文分词中文分词统计法:统计法:最大概率分词法最大概率分词法有有意意见见分分岐岐要计算要计算P(WP(W1 1S)S)和和P(WP(W2 2S)S),先计算先计算:P(WS)P(WS)P(WS)=

30、P(WS)=P(SW)P(W)P(SW)P(W)P(S)P(S)假设:假设:每个词之间的概率是上下文无关的,则:每个词之间的概率是上下文无关的,则:P(W)P(W)P(WS)=P(WS)=P(SW)P(W)P(SW)P(W)P(S)P(S)2424Electronic BusinessElectronic BusinessElectronic BusinessElectronic Business电子商务电子商务电子商务电子商务 第第0808讲讲 北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院电子商务搜索引擎技术电子商务搜索引擎技术p搜索引擎的

31、关键技术搜索引擎的关键技术中文分词中文分词统计法:统计法:最大概率分词法最大概率分词法有有意意见见分分岐岐P(W)=P(WP(W)=P(W1 1,W W2 2,,W Wi i)P(W P(W1 1)P(W)P(W2 2)P(W)P(Wi i)P(WP(Wi i)=)=W Wi i在语料库中出现的次数在语料库中出现的次数n n语料库中的总词数语料库中的总词数N N2525Electronic BusinessElectronic BusinessElectronic BusinessElectronic Business电子商务电子商务电子商务电子商务 第第0808讲讲 北京科技大学经济管理学院

32、北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院电子商务搜索引擎技术电子商务搜索引擎技术p搜索引擎的关键技术搜索引擎的关键技术中文分词中文分词统计法:统计法:最大概率分词法最大概率分词法有有意意见见分分岐岐表:词语概率表表:词语概率表词语词语概率概率有有0.0180有意有意0.0005意见意见0.0010见见0.0002分歧分歧0.0001P(WP(W1 1)=)=P(P(有有)P()P(意见意见)P()P(分歧分歧)=1.8 10=1.8 10-9-9P(WP(W2 2)=)=P(P(有意有意)P()P(见见)P()P(分歧分歧)=1.0 10=1.0 10-11-1

33、1可得:可得:P(WP(W1 1)P(W)P(W2 2)2626Electronic BusinessElectronic BusinessElectronic BusinessElectronic Business电子商务电子商务电子商务电子商务 第第0808讲讲 北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院电子商务搜索引擎技术电子商务搜索引擎技术p中文分词中文分词n问题:问题:比较计算出词与词之间组合的概率差异后,对于一个比较计算出词与词之间组合的概率差异后,对于一个待分词的词串,如何待分词的词串,如何尽快尽快找到找到最佳的分词路径最佳的

34、分词路径呢?呢?n最佳(概率最大)分词路径最佳(概率最大)分词路径“左邻词左邻词”:对字串:对字串从左到右进行扫描从左到右进行扫描,可以得到可以得到 W W1 1,W,W2 2,,W Wi-1i-1,W Wi i,W Wn n;等若干候选词,如果等若干候选词,如果W Wi-1i-1的尾字与的尾字与W Wi i 的首字的首字邻接,就称邻接,就称W Wi-1i-1为为W Wi i 的左的左邻词。邻词。“最佳左邻词最佳左邻词”:如果某个候选词如果某个候选词W Wi i有若干有若干个左邻词个左邻词W Wj j,W,Wk k,等等 ,其中,其中累计累计概率概率最大的候选词称为最大的候选词称为W Wi i

35、的最佳左邻的最佳左邻词。词。有有意意见见分分岐岐P P(W(Wi i)=)=P P (W(Wi-1i-1)P(W)P(Wi i)2727Electronic BusinessElectronic BusinessElectronic BusinessElectronic Business电子商务电子商务电子商务电子商务 第第0808讲讲 北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院电子商务搜索引擎技术电子商务搜索引擎技术p中文分词中文分词n问题:问题:根据以上数学原理,如何开发一个最大概率分词算法根据以上数学原理,如何开发一个最大概率分词算法

36、呢?呢?n最大概率分词最大概率分词算法描述算法描述STEP-1:STEP-1:对一个待分词的字串对一个待分词的字串S S,按照从左到右的顺序取出全部候选词,按照从左到右的顺序取出全部候选词W W1 1,W W2 2,,W Wi i,W,Wn n;STEP-2:STEP-2:到词典中查出每个候选词的概率值到词典中查出每个候选词的概率值P(WP(Wi i),并记录候选词的全部左邻词;,并记录候选词的全部左邻词;STEP-3:STEP-3:按照按照 计算每个候选词的累积概率,同时比计算每个候选词的累积概率,同时比较得到每个候选词的最佳左邻词;较得到每个候选词的最佳左邻词;STEP-4:STEP-4:

37、如果当前词如果当前词W Wn n是字串是字串S S的尾词,且累计概率;的尾词,且累计概率;P P(W Wn n)最大,则最大,则W Wn n就是就是S S的终的终点词;点词;STEP-5:STEP-5:从从W Wn n 开始,按照从右到左的顺序,依次将每个词的最佳左邻词输出,即开始,按照从右到左的顺序,依次将每个词的最佳左邻词输出,即为为S S的分词结果。的分词结果。P P(W(Wi i)=)=P P (W(Wi-1i-1)P(W)P(Wi i)2828Electronic BusinessElectronic BusinessElectronic BusinessElectronic Bus

38、iness电子商务电子商务电子商务电子商务 第第0808讲讲 北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院电子商务搜索引擎技术电子商务搜索引擎技术p中文分词中文分词n进一步深入探讨的问题:进一步深入探讨的问题:新词如何发现?新词如何发现?词库如何补充?词库如何补充?词性如何区分并标注?词性如何区分并标注?2929Electronic BusinessElectronic BusinessElectronic BusinessElectronic Business电子商务电子商务电子商务电子商务 第第0808讲讲 北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院北京科技大学经济管理学院本讲结束本讲结束谢谢谢谢!3030

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!