没有规则可言,AI野蛮掠夺,互联网进入了至暗时代!刚发现我发表的原创内容被 DEEPSEEK、豆包、文心一言等 AI 聊天机器人白嫖了。
刚刚我用AI聊天机器人搜了一下我的名字,没想到我的个人信息全部泄漏了。AI聊天机器人参考了7条网页信息源,其中第1条就是我个人网站的内容,然后就把息全部给扒出来了,对此我深表不安。未经我网站书面许可,AI竟然自动检索我网站内容,这不是白嫖吗?有什么办法能够防止AI检索我网站的原创内容吗?
在互联网初期,像Google、Bing这些搜索引擎巨头都不敢随意索引别人的网站,那时候搜索引擎和网站达成了一个君子协定,这个君子协定就是robots.txt,robots.txt是搜索引擎爬虫协议,也就是你的网站和爬虫之间约定俗称的一个协议,虽然不是强制性的,但双方意念合一。
比如我网站的robots.txt(详见https://www.cad2d3d.com/robots.txt)内容如下:
User-agent: *
Disallow: /phpMyAdmin/
Disallow: /beautiful-life/
Disallow: /user/
其中,User-agen t代表搜索引擎,* 代表所有,当然我也可以针对某个搜索引擎单独制定规则,比如针对百度搜索引擎,可以写成 User-agent: baiduspider。
Disallow是不允许访问的意思,可以指定哪些文件夹不允许搜索引擎访问。
AI聊天机器人本质是搜索引擎2.0,可惜到了AI时代,互联网竟然退回到原始的丛林社会,内容剽窃习以为常,野蛮掠夺成为了常态,各大厂商毫无忌惮,肆意掠夺我们的原创内容,白嫖我们的劳动成果,然后它们自己赚的盆满钵满。
如何才能防止AI白嫖我们的原创内容?在原始野蛮的AI时代,我们好像无能为力。
留言说明
如对本文有疑问,可关注微信公众号 科技大爆炸TheBigBang 直接留言即可。
手机扫描下方二维码直接关注 科技大爆炸TheBigBang。
也可以直接发邮件给我,我的邮箱18036678070@cad2d3d.com
转载请注明
文章作者:尚延伟 原文链接:https://www.cad2d3d.com/post-2181.html