-
调研分享:Flipboard的使用特点和页面信息抽取机制
Flipboard是什么? 封面 封面 标榜为“社会化杂志”,是ipad上的app应用,可以订阅twitter和facebook上的人、群组和话题,可以订阅flipboard(后面简称flip)指定的杂志类别,也可以订阅高质量的媒体站点,通过这些渠道,用户可以获得包括新闻、图片、视频、博客、微博等形式的数据,通过触屏点击进行预览、翻屏等操作,操作简单,内容组织图文并茂,类似于传统的杂志。 内容…...- 塵風
- 0
- 0
- 907
-
语音搜索的基础-语音识别
一直在想,假如有一天我们生活中的机器人像在很多科幻电影里面看到的那样,能够理解人类的语言,并能完成与人类的自然对话,是多爽的事情。语音的研究一直在试图解决这个问题。例如,语音到文字,即通常所说的语音识别,就试图将语音转换为文字,然后交给计算机进行后续的理解;而文字到语音,即语音合成,则试图将文字转换为声音,让人类可以听到。也许通过全世界语音界的科研和工程人员的努力,在不久的将来,我们真的可以和机器…...- 塵風
- 0
- 0
- 376
-
“分布式哈希”和“一致性哈希”的概念与算法实现
分布式哈希和一致性哈希是分布式存储和p2p网络中说的比较多的两个概念了。介绍的论文很多,这里做一个入门性质的介绍。 分布式哈希(DHT) 两个key point:每个节点只维护一部分路由;每个节点只存储一部分数据。从而实现整个网络中的寻址和存储。DHT只是一个概念,提出了这样一种网络模型。并且说明它是对分布式存储很有好处的。但具体怎么实现,并不是DHT的范畴。 一致性哈希: DHT的一…...- 塵風
- 0
- 0
- 484
-
基于hash计算的多层实验流量切分的实现
1. 背景介绍 站点新功能或者是站内新策略开发完毕之后,在全流量上线之前要评估新功能或者新策略的优劣,常用的评估方法是A-B测试,做法是在全量中抽样出两份小流量,分别走新策略分支和旧策略分支,通过对比这两份流量下的各指标的差异,我们可以评估出…...- 塵風
- 0
- 0
- 446
-
相似度计算常用方法综述
引言 相似度计算用于衡量对象之间的相似程度,在数据挖掘、自然语言处理中是一个基础性计算。其中的关键技术主要是两个部分,对象的特征表示,特征集合之间的相似关系。在信息检索、网页判重、推荐系统等,都涉及到对象之间或者对象和对象集合的相似性的计算。而针对不同的应用场景,受限于数据规模、时空开销等的限制,相似度计算方法的选择又会有所…...- 塵風
- 0
- 0
- 574
-
Boosting算法简介
一、Boosting算法的发展历史 Boosting算法是一种把若干个分类器整合为一个分类器的方法,在boosting算法产生之前,还出现过两种比较重要的将多个分类器整合为一个分类器的方法,即boostrapping方法和bagging方法。我们先简要介绍一下bootstrapping方法和bagging方法。 1)bootstrapping方法的主要过程 主要步骤: i)重复地从…...- 塵風
- 0
- 0
- 506
-
搜索引擎中的粒度问题
一.前言 传统的搜索引擎的定义,是指一种对于指定的查询(Query),能够返回与之相关的文档集合(Documents)的系统。而百度将这个定义更加丰富化,即搜索引擎能够帮助人们更方便的找到所求。这里的“所求”,比“文档”更加宽泛和丰富,比如一个关于天气的查询,直接返回一个天气预报的窗口,而非一篇关于天气的文档;再如一个关于小游戏的查询,直接返回这个小游戏的Flash页面而非简单的介绍性的文字。 百…...- 塵風
- 0
- 0
- 632
-
搜索背后的奥秘–浅谈语义主题计算
摘要: 两篇文档是否相关往往不只决定于字面上的词语重复,还取决于文字背后的语义关联。对语义关联的挖掘,可以让我们的搜索更加智能化。本文着重介绍了一个语义挖掘的利器:主题模型。主题模型是对文字隐含主题进行建模的方法。它克服了传统信息检索中文档相似度计算方法的缺点,并且能够在海量互联网数据中自动寻找出文字间的语义主题。近些年来各大互联网公司都开始了这方面的探索和尝试。就让我们看一下究竟吧。 关键词:主…...- 塵風
- 0
- 0
- 434
-
基于主特征空间相似度计算的切分算法及切分框架
我们为什么要切分? 说到切分(segmentation),大多数人最容易想到的就是中文分词。作为没有天然空格区分的语言,切词可以帮助计算机去索引文章,从而便于信息检索等方面。该部分主要用到了分词的一个方面:降低搜索引擎的性能消耗。我们常用的汉字有5000多个,常用词组是几十万个。在倒排索引中,如果用每个字做索引的话,那么会造成每个字对应的拉链非常长。所以我们一般会用词组来代替单个汉字建立索引。除此…...- 塵風
- 0
- 0
- 397
-
以求医为例谈搜索引擎排序算法的基础原理
我们向搜索引擎提交一个查询,搜索引擎会从先到后列出大量的结果,这些结果排序的标准是什么呢?这个看似简单的问题,却是信息检索专家们研究的核心难题之一。 为了说明这个问题,我们来研究一个比搜索引擎更加古老的话题:求医。比如,如果我牙疼,应该去看怎样的医生呢?假设我只有三种选择: A医生,既治眼病,又治胃病;B医生,既治牙病,又治胃病,还治眼病;C医生,专治牙病。 A医生肯定不在考虑之列。B医生和C医生…...- 塵風
- 0
- 0
- 408
-
SEO可以给企业带来什么好处?
每个组织都需要搜索引擎优化才能在数字市场中保持竞争力。但是,SEO对小型企业的好处尤其显著。 SEO是提高网站在搜索结果中可见性的最有效方法。它可以在客户购买过程中的关键时刻接触到客户,并促进销售和查询。更重要的是,它有助于建立品牌知名度,信誉和信任。 随着消费者转向与品牌的数字互动,了解如何保持在线竞争力至关重要。特别是如果您是一家中小型企业,正在寻找具有成本效益的营销解决方案,SEO是您的首选…...- 靓仔编辑
- 0
- 0
- 54
-
孤立页面是什么意思?孤立页面介绍以及查找和修复方法
您是否有页面有可能排名和推动自然搜索流量,但不是您网站结构的一部分?或者不应该出现在您网站上的页面,但Google还是找到了它们? 答案几乎是肯定的。至少,它是针对大量网站的!这些页面称为孤立页面。 简而言之,网站上没有入站链接的页面是孤立页面。 在这篇文章中,您将了解什么是孤立页面,为什么它们很重要,如何找到它们,以及如何将它们整合到您的网站结构中,以实现成功的SEO策略。 1什么是孤立页面? …...- 靓仔编辑
- 0
- 0
- 90
-
12个最好的关键字研究工具分享
如果您想进行有效的关键字研究,找到最佳关键字并改善网站的SEO,则需要使用最好的工具。但是,随着新工具、新算法和新竞争的不断涌现,您如何知道哪些工具适合您? 下面,我们将探讨 12 个关键字研究工具,您可以使用这些工具来增强内容的能力,并与受众群体对话: 1. Semrush Keyword Magic Tool 2. Semrush Keyword Gap Tool 3. Semrush Pos…...- 靓仔编辑
- 0
- 0
- 18
-
如何使用竞争对手关键字改进我们的营销?
什么是竞争对手关键字? 竞争对手关键字是您的竞争对手当前针对的关键字,旨在提高排名并产生更多在线流量。 定位竞争对手关键字可帮助您与竞争对手显示在相同的SERP(搜索引擎结果页面)上。您还可以使用竞争对手的关键字研究来揭示弱点,例如他们尚未定位的有价值的关键字。 利用这些信息,您可以执行竞争对手关键字分析,以找出接下来要关注的关键字(稍后会详细介绍)。 什么是竞争对手关键词研究? 竞争对手关键字研…...- 靓仔编辑
- 0
- 0
- 35
-
SEO知识:关键字研究终极指南
出色的关键字研究揭示了对您的用户和客户很重要的术语,短语,问题和答案。您的关键字还应支持业务目标,例如获得更多网页浏览量、捕获潜在客户或销售产品和服务。 要将更多真正合格的潜在客户吸引到您的网站,您需要了解如何进行关键字研究。请继续阅读以了解有关其工作原理,为什么它很重要以及它如何帮助您制作内容的更多信息。 什么是关键字研究? 关键字研究是查找可能与您的业务和客户相关的所有可能的搜索查询的过程。关…...- 靓仔编辑
- 0
- 0
- 19
-
如何对关键字分析进行SEO工作
什么是关键字分析? 关键字分析是评估和分析关键字和搜索短语的过程,以确定哪些关键字和搜索短语可能会将访问者带到您的网站。 要确定哪些关键字最适合您的策略,您需要借助关键字建议工具进行彻底的关键字分析和评估。 如今,许多程序允许用户完成关键字分析。其中最着名的可能是Google的关键字规划师工具,但它没有为搜索字词提供全面的数据。 之前我们分享了:挖掘长尾关键字的工具分享、SEO知识:如何选择合适的…...- 靓仔编辑
- 0
- 0
- 11
-
挖掘长尾关键字的工具分享
挖掘长尾关键字的工具分享前言:昨天我们分享了:如何选择合适的长尾关键词,我想您阅读过后,已经了解了长尾关键字的好处,并知道如何搜索它们,您需要合适的工具来开始使用。 您可以使用许多关键字工具选项来查找利基中的长尾关键字列表。以下是我们的最爱。 工具列表 Keyword Magic Tool 使用关键字魔术工具,您可以输入关键字并选择您所在的国家/地区。Semrush将提供关键字列表,您可以过滤广泛…...- 靓仔编辑
- 0
- 0
- 46