¿Es legal que AIGC use tecnología de orugas para construir una versión Zhihu del robot GPT?

Este año, las herramientas de modelo a gran escala de inteligencia artificial, como GPT y pintura de IA, están de moda, y muchas personas también quieren seguir la ola del espíritu empresarial de IA, y los proyectos empresariales relacionados surgen sin cesar. Los datos de alta calidad son cruciales para el entrenamiento de grandes modelos de IA Solo con suficientes datos se pueden entrenar herramientas de IA inteligentes y potentes. Internet en mi país lleva más de 20 años en auge, pero ¿aún faltan datos? No, el abogado Mankiw recibió recientemente consultas de internautas sobre el uso de rastreadores para rastrear datos de Zhihu. ¿No sería genial ser un robot Zhihu GPT? Espere un minuto, los riesgos legales involucrados no pueden ser ignorados.

0****1 Los rastreadores son un arma de doble filo

La tecnología Crawler es una tecnología que obtiene automáticamente datos de Internet a través de la programación. Su nombre muestra vívida y vívidamente su principio de funcionamiento: simular el proceso de navegación humana en la web en un navegador web y recopilar y capturar datos.

Los rastreadores web se utilizan ampliamente en motores de búsqueda, recopilación de datos, filtrado de publicidad, análisis de big data y otros campos. Como un poderoso programa de recopilación de información, puede mejorar significativamente la eficiencia del trabajo, especialmente para la recopilación y disposición de datos masivos.

Sin embargo, una vez que la tecnología se usa incorrectamente, también causará un "desastre de gusanos", lo que provocará congestión de la red, fallas, parálisis del servidor e incluso riesgos de seguridad de datos. La "red de documentos de árbitros" con la que estamos familiarizados no es inmune:

Figura: En 2019, el Tribunal Popular Supremo emitió la "Respuesta a las sugerencias sobre la construcción del sitio web de la "Red de documentos de juicio de China""

0****2 Riesgo de usar tecnología de rastreo

Los rastreadores, como medio técnico para obtener datos, no están prohibidos por la ley. Sin embargo, la forma de uso y el propósito del uso determinan si habrá actos y consecuencias ilegales.

1. Uso inadecuado

Con la tecnología de rastreo, se puede realizar una gran cantidad de visitas al sitio web en un corto período de tiempo, y las páginas y los datos se rastrean con frecuencia. Esto puede conducir a un fuerte aumento en el ancho de banda y la carga del servidor del sitio web, afectando así el funcionamiento normal del sitio web, e incluso causando tiempo de inactividad o respuesta lenta, interfiriendo con el funcionamiento normal del sitio web visitado y, en casos severos, puede constituir un delito.

Yang autorizó a Zhang, un empleado de la compañía, a desarrollar un software de sistema de crédito, y la función de "rastreador web" en el software podría vincularse al sitio web del permiso de residencia de Shenzhen. En mayo de 2018, el software consultó una gran cantidad de visitas al sistema de permisos de residencia de Shenzhen durante dos horas consecutivas, lo que provocó que el sistema de permisos de residencia de Shenzhen no funcionara normalmente, lo que afectó en gran medida el funcionamiento diario de la oficina de gestión de población de la Oficina de Seguridad Pública de Shenzhen, que utiliza el sistema de permisos de residencia. Ambos constituían el delito de sabotaje de los sistemas informáticos de información. [(2019) Guangdong 0305 Xingchu No. 193]

2. Propósito de uso inadecuado

La forma en que se utilizan la información y los datos rastreados tiene un mayor impacto cualitativo en el comportamiento del rastreador que cómo se utilizan. **

El uso ilegal de datos e información rastreados incluye principalmente:

**(1) Robo de información personal: **El uso de tecnología de rastreo para capturar información personal de forma maliciosa en sitios web puede implicar la violación de la privacidad y la información personal de otras personas, lo que puede constituir un delito grave de violación de la información personal de los ciudadanos.

**(2) Comportamiento inadecuado en la competencia comercial: **Usar tecnología de rastreo para obtener los secretos comerciales de los competidores, información de precios, datos de usuario, etc., y "mover" a otras plataformas después de la integración de datos, y obtenerlos de esta manera conveniente Una gran cantidad de datos e información valiosos para buscar una ventaja competitiva desleal.

En el caso de "Kumike v. Chelai Disputa de competencia desleal", el tribunal sostuvo que, sin el permiso del obligante, el uso de la tecnología de rastreo web para ingresar al fondo del servidor del obligante obtuvo y usó ilegalmente el bus en tiempo real del obligante. información datos gratis El comportamiento es en realidad un tipo de comportamiento de "obtener algo por nada" y "canibalizar a las personas y engordar", y tiene la ocupación ilegal de los derechos e intereses de propiedad intangible de otras personas, destruyendo las ventajas competitivas del mercado de otras personas , y constituye competencia desleal.

**(3) Infracción de los derechos de propiedad intelectual: **Rastrear contenido protegido por derechos de autor y luego usarlo para fines comerciales o de difusión pública no autorizada es un acto de infracción de los derechos de propiedad intelectual.

0****3 El riesgo de que los datos del rastreador "alimenten" modelos grandes

A través del análisis anterior, podemos ver que el riesgo de usar la tecnología de rastreo radica principalmente en el método de rastreo y el contenido rastreado. **Ya sea para controlar la frecuencia y el contenido del rastreo, rastrear contenido público y usarlo para entrenar robots no es nada Arriesgarlo?

En primer lugar, ya en 2018, la cuenta oficial de Zhihu publicó el "Anuncio sobre la actualización de la protección de los derechos e intereses de los usuarios de Zhihu", que mencionaba: **Zhihu adopta un sistema de lista blanca para el uso del contenido de Zhihu por parte de terceros, y los terceros deben pasar Aplicar a través de los canales oficiales de cooperación. **Si el comportamiento de rastreo viola los términos de servicio de Zhihu, Zhihu puede tomar prohibiciones de cuentas, direcciones IP u otras acciones legales.

Extraído de "Especificaciones para el uso de cuentas institucionales de Zhihu" (prueba)

En segundo lugar, el contenido de Zhihu suele ser original o está autorizado por el usuario, y los derechos de autor pertenecen al propio usuario. El rastreo y el uso no autorizados de estos contenidos pueden implicar una infracción de los derechos de autor y los derechos de autor de Zhihu.

De hecho, entrenar modelos grandes de IA, el "robo de datos" no es un caso aislado. El mes pasado, Bishen Composition acusó públicamente a Xueersi, un ex socio, de “robar datos” a través de reptiles para entrenar sus propios productos de IA. Bishen Composition declaró que resolverá la disputa a través de procedimientos judiciales, requiriendo que "Xueersi" pague 1 yuan en compensación, se disculpe públicamente y elimine los datos rastreados.

0****4 Resumen

En el auge de las startups de IA, los datos son cada vez más importantes. Cuando se enfrenta al atractivo de la tecnología bot, se debe reconocer que, si bien la tecnología bot en sí misma no está prohibida, su uso inapropiado puede generar problemas legales, especialmente en relación con la información personal, la privacidad, los derechos de autor y la competencia desleal.

Las “Medidas Transitorias para la Gestión de los Servicios de Inteligencia Artificial Generativa” mencionan claramente que cuando se entrenen actividades de procesamiento de datos, se deben utilizar datos y modelos básicos con fuentes legales. En el proceso de iniciar un negocio, los jefes deben garantizar la legalidad y la moralidad de la recopilación de datos. Si desea usar datos rastreados para entrenar modelos grandes de IA, debe obtener la autorización de la fuente de datos con anticipación y cumplir con las regulaciones de la plataforma correspondiente.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
0/400
Sin comentarios
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)