前言（5）

在线为王比尔·唐瑟尔

关于数据资源

本书的故事情节及案例都是基于Hitwise 竞争情报服务公司（Hitwise Competitive Intelligence Service ）的数据资源撰写而成。如果没有特别说明，书中的分析、推理都是基于美国样本而展开的（其他数据来源还包括英国、中国香港、新加坡、澳大利亚和新西兰)。这一样本由1 000 万余名美国网民及其日常网络行为构成，样本的采集方法有两种。其中主要的方法是基于与全美国互联网服务提供商所达成的协议，对7 500 多万的网络用户进行匿名处理，

并整合统计其使用数据。数据来源于众多区域互联网服务提供商。互联网服务提供商的样本包括多个选择性使用的专门小组，或者接受调查并提供人口统计信息的网络用户群体。这一信息使得我们可以对访问各种网站或网站类别的用户进行人口统计和心理描绘的报告。互联网服务提供商和选择性使用的数据每天更新，提供以往的使用资料；搜索词条数据每周更新；人口统计和心理描绘数据以连续4 周的平均使用率为基础。

关于隐私权

当我向新闻界或商界的朋友首次谈起我们的数据资源时，最常碰到的问题就是这样搜集数据是否侵犯了终端用户的隐私权？在这里我首先要指出的是，保护终端用户的隐私权是企业实现自身利益最大化的重要前提。通常，我们会通过两个机制来实现对用户隐私权的保护。第一，数据收集部门会对原始数据进行匿名整合处理。这样一来，前向及后向部门都无法再将数据资源和具体用户对应起来。实际上，企业所进行的一切活动都是围绕着整合资源、发掘规律而展开，绝对不会去打探用户的个人隐私；第二，对于搜索关键词等方面的数据，我们也会进行相应的保密处理，删掉与身份识别相关的一切信息，如电话号码、信用卡号码、社保卡号等。所以说，我们的样本绝不会侵犯终端用户的隐私权。

本书简介

本书内容我们主要从两方面展开。首先，我们对近年来积累的、与数据资源相关的观点、事例作了详尽的分析和说明，你可以与我们一起分享。从人们喜好访问互联网的“阴暗面”——热衷于黄、赌、毒，到现代社会人们对名人的顶礼膜拜……通过对所有上述事例的分析，读者将会了解到应该怎样通过网络数据资源来具体剖析人们的特定行为。我们还将讨论人们在搜索引擎中输入的查询，这些问题又如何揭示我们的内心，例如搜索我们的恐惧，我们想要了解的事情，或者像“天空为什么是蓝色的”这样的普通问题。我们还讨论了互联网交流中的最新变革是如何改变人与人之间的互动方式。其次，我们将会进一步学习网络数据资源的理论及实践运用，包括互联网竞争情报行业的各种策略及应用，如何运用数据资源预测当前趋势和潮流，我们甚至能用网络流量数据来预测美国下一个摇滚巨星是谁。

要开始我们的网络行为探索之旅，从网络自身的弱点说起再合适不过。在网络营销界中，PPC 代表的是点击付费广告（pay per click），即广告投放商根据用户的点击量来支付相应的广告费用。但在本书中，PPC 有着完全不同的含义。在本书第1 章中，PPC 代表着色情（porn）、药物（pills ）和赌场（casinos）。这些关于人类恶习的网络数据向我们揭示了竞争情报数据是何等强大。网站访问量的上升与下降，网站访问的细分群体，以及用户群的访问意图等，都是我们所要研究的内容。