今年早些时候,美国航空公司在德克萨斯州联邦地方法院起诉Farechase公司,声称Farechase公司从美国航空公司网站上“抓取”美国航空公司的航班信息是非法的。这只是一系列挑战未经授权的网站数据收集的案件中最近的一起。

什么行为构成“屏幕抓取”?“刮痧”真的违法吗?这一系列案件对你的业务意味着什么?

什么是“屏幕抓取”?

尽管它的名字带有贬义,但屏幕抓取软件只是简单地从其他互联网网站收集和汇总数据,供收集方使用。通常,目的是对数据进行改造并显示数据,以使收集方的客户受益。

数据聚合的例子包括从在零售网站上收集价格的网站到在共同基金和银行网站上收集个人财务数据的公司,这些公司允许注册用户在单个网站上访问多个帐户的信息。

执行这一功能的软件——通常被称为机器人(或“bot”)、“蜘蛛”或“爬虫”——在网站上搜索特定信息。

Farechase的案例提供了这种技术如何工作的一个例子。Farechase的客户是旅行社。当客户使用Farechase搜索特定的航空公司、酒店或汽车租赁价格时,Farechase的软件会搜索不同的航空公司网站,并收集提供的“网络票价”。一个受欢迎的网站,如AA.com,每天可能会被搜索数千次,以回应Farechase客户提出的问题。

Farechase的实时搜索技术是传统数据挖掘技术的一个进步,传统数据挖掘是指公司定期搜索网站,并维护一个单独的数据库,供用户查询。例如,在销售书籍或音乐的网站中,只要数据库经常更新,实时搜索可能就不是必需的。

Farechase将这一概念进一步推进,允许用户在搜索时立即搜索票价,从而保证搜索结果是最新的。

不用说,一个人对这种类型的数据挖掘的看法在很大程度上取决于他是刮刀者还是被刮刀者!

这种做法的目标,如美国航空公司,抱怨由于数据抓取而产生的持续流量给他们的互联网服务器带来了额外的负担,减慢了他们对合法用户的响应时间。

在Farechase案中,美国航空公司声称,如果不加以制止,到2003年底,Farechase每天的搜索量将超过20万次。此外,它还认为,由于Farechase允许顾客直接进入美国航空公司在AA.com上的订票页面来获取网上机票,美国航空公司无法与顾客建立关系,否则,如果顾客被要求浏览AA.com的初步页面,美国航空公司就会因此失去美国顾客的好感。

另一方面,Farechase等公司认为他们的服务鼓励比较购物。Farechase说,抵制它的公司害怕由此带来的竞争(和更低的价格)。

技术防御

在讨论“屏幕抓取”的合法性之前,值得指出的是,受到这种做法攻击并反对这种做法的公司,在授权律师提起诉讼之前,往往会采取一种“自救”措施。这种自救有时会导致一场堪比威廉·吉布森(William Gibson)小说的技术之战。

防御者试图识别并阻止攻击者的IP (Internet Protocol)地址。攻击者通过使用虚假IP地址来隐藏或伪装其抓取器的身份,从而避开拦截防火墙。

攻击者不会轻易气馁,他们似乎有无限的伪装,使这场高科技的猫捉老鼠游戏得以延续。在一些案件中,攻击者占了上风。结果,这些纠纷中有几起在法庭上结束了。

法律防御

当技术防御失败时,像美国航空公司这样的“刮屏”目标有两种主要的法律武器可以用来防御。第一种是声称违反了在线点击包装或浏览包装许可。第二种是声称“侵权”(或法律错误),最常见的是“动产侵权”。

在对Farechase的案件中,美国航空公司试图同时向对手开火。但它的开场攻势很弱。

首先,美国航空声称Farechase违反了美国航空的“浏览-包装”协议。美国航空使用“browse-wrap”一词是指出现在网站上的在线协议(通常在条款和条件链接下),但不要求用户在继续使用该网站之前点击或表示同意该协议。

相比之下,更为人所知的(也是更有效的)“点击包装”协议要求首次用户在进入网站之前点击一个单词或符号来表示接受网站的许可条款。虽然正确执行的点击包装协议的用户可以期望强制执行,但还没有法院强制执行浏览包装协议,而且仅有的两个考虑过这个问题的法院对这种协议的可执行性表示怀疑。

然而,波士顿第一巡回上诉法院最近的一项裁决可能会提高保护网站的能力,因为网站上只有一份明确的限制访问的声明。该法院认为,屏幕抓取可能违反了《计算机欺诈和滥用法》(CFAA),而在浏览包装协议中使用的那种限制性警告可能足以援引《计算机欺诈和滥用法》。

美国人的第二管枪管装上了威力更大的弹药,其形式是声称Farechase违反了“侵犯动产”(即货物)的法律。虽然适用于动产的英国侵权法可以追溯到几百年前,但它已经显示出一种令人惊讶的适应互联网法律的能力。

大多数考虑过非法侵入法适用于数据收集的法院都做出了有利于起诉方的裁决。这些案件中最著名的是eBay, Inc.诉Bidder's Edge, Inc.,该案件导致了一项禁令,要求Bidder's Edge停止从eBay网站上进行数据挖掘。

此外,在其中一些案件中,法院没有要求提供证据,证明这些数据搜集者对数据挖掘的网站造成了任何可衡量的损害,或任何具体的损害。

毫不奇怪,根据上述记录,美国航空公司成功地获得了针对Farechase的禁令。虽然Farechase仍在营业,但它的搜索不再包括美国网站的票价。

从这里到哪里?

基于这种法律状态,数据挖掘者能指望建立一个基于未经授权的屏幕抓取的业务吗?

令人有些意外的是,前景可能比看上去要好。

首先,许多公司利用这种形式的数据挖掘,没有遭到他们正在抓取的网站所有者的反对。原因是经济上的,而不是法律上的。

在某些行业,屏幕抓取已经成为一种公认的商业方法。此外,绝大多数公司都愿意在合作的情况下提供访问其网站的权限。只要scraper的客户最终被推荐到供应商的网站进行购买,那么它们的容量的某些百分比被使用并不是一种威慑。

第二,虽然法律到目前为止对原创内容提供商有利,但关于电子侵权动产的法律还远未解决。加州最高法院最近在英特尔诉哈马迪案中作出裁决,驳回了英特尔试图阻止一名前雇员向英特尔员工群发电子邮件的请求。

在那起案件中,法院认为,根据加州法律,对动产的电子侵权不能提起诉讼,除非它涉及“对个人财产或个人财产所有者受法律保护的利益的实际或威胁损害”。

由于哈马迪发给英特尔员工的电子邮件(数以十万计)没有造成这样的伤害,法院拒绝命令哈马迪停止通信。虽然这个案例不是屏幕抓取案例,但涉及的问题本质上是相同的(英特尔严重依赖于抓取案例),因此Hamadi可能是抓取者未来使用的重要防御工具。

注册免费阅读全文。输入您的电子邮件地址以继续阅读…

你喜欢这篇文章吗?
你知道谁也会喜欢吗?与你的朋友分享,免费的,无需注册!只要分享这个链接,他们就会立即访问…
  • 复制链接

  • 电子邮件

  • 推特

  • 脸谱网

  • Pinterest

  • Linkedin


作者简介

李Gesmer他是Lucash, Gesmer & Updegrove LLC(一家波士顿律师事务所,专注于高科技公司代表的各个方面)的合伙人和创始人。可以联系到他gesmer@lgu.com