일반적인 생활 정보 정리
미래에는 사람들이 정보를 얻기 위해 쓰는 주요 검색 수단 중에는 검색 엔진, AI 챗봇 이 존재할 것입니다. 앞으로는 AI 챗봇이 더욱 주된 수단이 될 것이라는 예측도 나오고 있습니다. AI 챗봇의 발전과 검색의 변화를 함께 정리해 보았습니다. 데이터 접근에 대한 새로운 논의와 웹사이트와 AI 기업 간의 관계, 그리고 앞으로의 검색 트렌드에 대해 정보를 얻어가셨으면 합니다.
AI 챗봇과 검색 엔진은 인터넷의 글이나 이미지 등의 자료를 수집(크롤링)하여 정보를 제공하는 점에서 유사합니다. 그러나 그들이 정보를 전달하는 방식에는 큰 차이가 있습니다.
검색 엔진은 사용자를 정보의 원본 사이트로 안내하는 반면, AI 챗봇은 정보를 독립적으로 처리하고 요약하여 직접적인 응답을 제공합니다. 이런 특성 때문에 AI 챗봇이 제공하는 정보가 미디어, 커뮤니티, 지식 플랫폼 등의 생존을 어렵게 만들 수 있습니다.
예를 들어, GPT-4의 출시 이후 많은 프로그래머들이 AI에 질문을 시작하였고, 이로 인해 프로그래머 커뮤니티인 Stack Overflow의 방문자 수가 크게 감소한 사례도 있습니다. 이는 AI가 기존의 웹사이트의 역할을 대체하고 있다는 사실을 보여줍니다.
간단히 말하면, 검색 엔진은 원본 사이트로의 연결을 제공하는 반면, AI 챗봇은 독립적인 답변을 제공하며, 이러한 차이로 인해 기존의 정보 제공 플랫폼들에 변화의 바람이 불고 있습니다.
AI 챗봇의 학습을 위한 데이터 크롤링이 활발해지면서, 많은 웹사이트들이 크롤링을 차단하기 시작했습니다. 특히 유명 언론사들은 AI 학습과 관련된 크롤링을 차단하고 있다고 합니다. 차단이 많이 된다라는 것은 챗봇 기능의 정확도가 떨어질 수 있습니다.
2023년 9월 22일 기준으로 Originality.AI의 연구 결과, 전 세계 상위 1000개 웹사이트 중 약 25.9%가 AI 챗봇의 학습을 위한 크롤링을 차단하였습니다. 그리고 이러한 차단하는 웹사이트의 수는 지속적으로 증가하고 있습니다.
이 연구는 OpenAI의 GPTBot와 관련하여 세계 상위 1000개 웹사이트의 반응을 분석한 내용을 담고 있습니다. 주요 내용은 다음과 같습니다.
-. 세계 상위 1000개 웹사이트 중 얼마나 많은 사이트가 GPTBot를 차단하고 있는지 분석하였습니다.
-. OpenAI는 2023년 8월 7일에 GPTBot를 차단하는 방법에 대한 세부 정보를 공유했습니다.
✅ 주요 결과
상위 1000개 웹사이트 중 25.9%가 GPTBot를 차단하고 있습니다. GPTBot를 차단하는 주요 웹사이트로는 Pinterest, Amazon, Quora, 인디드 등이 있습니다. 대부분의 대형 미디어/뉴스 게시자들도 GPTBot를 차단하고 있습니다.
✅ 차단 시작 웹사이트
GPTBot를 처음 차단한 웹사이트로는 Amazon, Quora, NYTimes, Shutterstock, Wikihow, CNN 등이 있습니다.
데이터를 생산하는 기업들은 자신들의 데이터가 검색엔진이나 AI 챗봇에 의해 활용되는 것을 문제 삼고 있습니다.
<관련기사 모으기>
국제 기사
국내 기사
데이터 접근 권한과 관련된 이슈는 앞으로도 계속될 것으로 보입니다. 데이터 생산 기업과 검색엔진, AI 챗봇 기업 간의 협상과 대화를 통해 미래의 검색 방식과 결과에 어떠한 변화가 생길지 주목해야 할 것입니다.
미래의 검색 방식과 결과는 기술의 발전과 함께 계속해서 변화할 것입니다. 사용자들의 정보 접근 방식과 데이터의 가치에 대한 인식 변화도 이러한 변화를 주도할 것으로 예상됩니다.