脸书人工智能背后的人工：将用户私人数据标注外包给了印度人_数据_工作

2024-12-09 12:36:09 计算机

对付数据标注工，许多人或许并不陌生。
像许多科技公司一样，Facebook利用机器学习和AI系统在其平台上对内容进行排序。
但为了做到这一点，须要对软件进行演习，以识别不同类型的内容。
为了演习这些算法，科技公司必须剖析样本数据，所有这些都须要由人类进行分类和标记。
这些人是人工智能背后的人工，也被称为智能时期背后的隐形者。

脸书人工智能背后的人工：将用户私人数据标注外包给了印度人_数据_工作计算机

据路透社宣布，Facebook将部分的数据标注事情外包给了印度公司WiPro。
该公司雇用了260多名工人，以五个种别对用户发布的私人帖子进行标注。
例如，帖子的内容（是自拍或食品图片）、场合（是生日还是婚礼）、作者的意图（他们是开个玩笑，试图勉励他人，还是组织一个聚会）。
为了担保数据标注的准确性，每条内容由WiPro的两名工人检讨准确性，每个工人每天注释大约700条内容。

Facebook确认了WiPro的事情，并表示WiPro工人正在检讨和标注的内容包括选天命量的用户私人共享内容，个中部分数据包含用户姓名和其他敏感信息。
同时，Facebook表示，公司在环球范围里有200个类似的项目，统共雇佣了数千人。
只管Facebook表示，外包出去的数据标注事情得到了公司法律和隐私团队的批准，但鉴于Facebook之前在数据安全上的表现，许多用户仍表示担忧。

在人工智能时期，对付机器学习和深度学习等算法来说，数据量越大、质量越好，算法模型就表现越好。
可以说，数据决定着全体人工智能行业的发展态势。
Facebook人工智能产品管理总监Nipun Mathur认为，这类事情是人工智能的核心。

但标注事情本身是一个劳动密集型工种，收入也不高，听上去有点像呼叫中央的事情。
因此，大部分的公司将这类事情外包给了人工较为便宜的国家。
在中国，也有大量的“数据标注者”每天对着电脑，标记供自动驾驶汽车学习的图像，以便演习他们识别自行车和行人。

为了更好的智能化，数据标注事情是必要的，但当标记的数据涉及到用户个人隐私时，问题就来了。
比如前段韶光闹得沸沸扬扬的某购物App窃听事宜，许多用户疑惑该运用程序监控或是窃听了自己的社交内容，从而天生推举商品推送给了自己。

当你和你的朋友交谈谈天时，你不认为有其他人会听到你们的发言，但现在这变成了可能。
尤其是昔时夜公司将你的数据外包给那些采取更低安全标准和隐私的公司时，问题变得令人更加不安。