هوش مصنوعی به خواست سایت‌ها برای عدم استخراج داده توجهی ندارد_به رنگ صبح

نوشته و ویرایش شده توسط مجله به رنگ صبح

مطابق حرف های‌های استارتاپ TollBit، چندین شرکت هوش مصنوعی انگارً پروتکل امنیتی سایت‌ها را که برای جلوگیری از استخراج یا اسکرپینگ مطالب آن‌ها منفعت گیری می‌بشود، دور می‌زنند. هرچند TollBit نام هیچ شرکت هوش مصنوعی را ذکر نکرده، اما به‌نظر می‌رسد دو شرکت بزرگ OpenAI و Anthropic نیز این پروتکل‌ها را نادیده می‌گیرند.

شرکت هوش مصنوعی Perplexity در چند روز قبل مورد انتقاد قرار گرفت و فوربز این شرکت را به سرقت مطالبش متهم کرده است؛ به‌نظر می‌رسد این شرکت هوش مصنوعی دستورات فایل robots.txt را نادیده می‌گیرد و وب‌سایت فوربز را اسکرپ می‌کند.

اکنون، رویترز به نقل از استارتاپ TollBit گزارش می‌دهد که Perplexity تنها شرکت هوش مصنوعی نیست که پروتکل robots.txt را دور می‌زند و اطلاعات وب‌سایت‌ها را برای دریافت محتوایی که برای آموزش هوش مصنوعی آن‌ها منفعت گیری می‌بشود، استخراج می‌کند.

ادامه مطلب

ویدیوی قاب منتسب به آیفون 16، طراحی این گوشی را قبول می‌کند + ویدیو_به رنگ صبح

بی‌توجهی شرکت‌های هوش مصنوعی به پروتکل امنیتی سایت‌ها

هوش مصنوعی به خواست سایت‌ها برای عدم استخراج داده توجهی ندارد_به رنگ صبح ۴

TollBit استارتاپی است که سایت‌ها و ناشران را به شرکت‌های هوش مصنوعی وصل می‌کند تا این شرکت‌ها بتوانند مجوز منفعت گیری از مطالب دریافت کنند. اکنون این استارتاپ در نامه‌ای به سایت‌ها و ناشران حرف های است:

آخرین مطالب

«ابزارهای هوش مصنوعی از منبع های متعدد (نه فقط یک شرکت) ترجیح خواهند داد که پروتکل robots.txt را برای کسب محتوا دور بزنند.»

فایل‌های robots.txt حاوی دستورالعمل‌هایی برای خزنده‌های وب است که در آن ذکر شده کدام نوشته را می‌توان استخراج کرد و کدام یک را نمی‌توان. گفتنی است که گسترش‌دهندگان وب از سال ۱۹۹۴ از این پروتکل منفعت گیری می‌کنند.

ادامه مطلب

بدترین و ترسناک ترین تله ها در سری فیلم های اره

در نامه TollBit نام هیچ شرکتی ذکر نشده، اما اینسایدر دریافته است که OpenAI و Anthropic درحال دورزدن فایل‌های robots.txt می باشند. یقیناً هر دو شرکت قبلاً اظهار کرده بودند که به دستورالعمل‌هایی که وب‌سایت‌ها در فایل‌های robots.txt خود قرار داده‌اند، احترام می‌گذارند.

به‌طورکلی، با ظهور هوش مصنوعی مولد، استارتاپ‌ها و شرکت‌های فناوری درحال رقابت برای ساخت نیرومندترین مدل‌های هوش مصنوعی می باشند. یک عنصر کلیدی در این فرایند، کسب داده‌هایی با کیفیت و کمیت بالا است. اکنون عطش دریافت این چنین داده‌هایی برای آموزش هوش مصنوعی، پروتکل robots.txt و دیگر توافق‌ها را تضعیف کرده است.

دسته بندی مطالب