구글의 설립자인 래리 페이지,
그가 관심있었던 분야는 "모든 도서의 디지털화" 였음
2002년, 구글은 그 첫번째 시작을 위해
미국 미시간 대학교와 계약해 대학교 내 모든 책을 스캔,
데이터화 시키는 작업을 했고
이어 하버드, 스탠포드, 옥스퍼드 등 유명 대학들과도 계약함
도서를 훼손하지 않기 위해 개발된
구글의 도서 스캐너는 시간당 1,000페이지 정도의 책을 스캔할 수 있었으며,
가장자리의 왜곡이나 문자 인식을 위해
이 프로젝트에만 수십명의 SW엔지니어들이 붙어있었다고 함
결국 수년에 걸쳐 구글은
2500만권의 책을 데이터베이스화 하는데 성공
하지만 미국 작가 협회와 미국 출판 업계가
구글을 상대로 저작권법을 근거로 소송에 나섰는데
사실 구글은 이 스캔한 책을 판매할 생각이 없고
다만 일부나 색인만 검색할 수 있게 만들 계획이었고
심지어 절판된 책을 판매해 작가나 출판사에 수익을 나눠줄 계획이었기에
소송은 구글이 출판사에게 수익을 배분한다는 화해안이 생김
하지만 검색업계의 경쟁업체인 MS와
디지털도서업계의 경쟁업체인 아마존이
독점을 근거로 화해안에 거부,
결국 구글의 2500만권의 책 데이터는
구글에서조차 데이터 관리를 위한 특수한 상황 말고
아무도 볼 수 없게 됐는데 이 데이터는 약 50~60페타바이트라고
구글 입장에서는 빅데이터로 써먹을 수 있으니 밑지는 장사는 아닐듯...
본인들 생각처럼 썼으면 더 벌었겠지만
나중에 아포칼립스 한번 터지고 로스트 테크놀러지 하면서 나오는거지
인류멸망후 숨겨진보물이 되겟는데
아직 구글이 evil이 아닐 시기인가
사업적인 영향력은 별개로 최초 의도는 선했으니까
이번에 절판되고 오래된 옛날 책 구텐베르크 프로젝트로 다시 볼 수 있었어서 더 와닿네
귀여니 책같은거 어떻게 스캔되는지 보고싶었는데
캬 미쳤다
사렌마마
2024/10/24 11:31
구글 입장에서는 빅데이터로 써먹을 수 있으니 밑지는 장사는 아닐듯...
본인들 생각처럼 썼으면 더 벌었겠지만
루리웹-4485269759
2024/10/24 11:33
빅데이터로도 써먹으면 안 될 걸. 이미 썼겠지만.
사렌마마
2024/10/24 11:34
안되지요. 암....
Eㅔ디
2024/10/24 11:31
나중에 아포칼립스 한번 터지고 로스트 테크놀러지 하면서 나오는거지
마지야바
2024/10/24 11:31
인류멸망후 숨겨진보물이 되겟는데
루리3864웹
2024/10/24 11:32
아직 구글이 evil이 아닐 시기인가
사업적인 영향력은 별개로 최초 의도는 선했으니까
이번에 절판되고 오래된 옛날 책 구텐베르크 프로젝트로 다시 볼 수 있었어서 더 와닿네
TooFast
2024/10/24 11:34
지금 구글이 이블 하지는 않진 않나
게이게이야..
2024/10/24 11:32
귀여니 책같은거 어떻게 스캔되는지 보고싶었는데
한프런트
2024/10/24 11:33
캬 미쳤다
마곡나룻
2024/10/24 11:34
사내에서 쓰면 되것구먼
압카이
2024/10/24 11:34
진짜 STC가 되겠네
루리웹-8213148551
2024/10/24 11:34
하지만 검색업계의 경쟁업체인 MS와
MS 가 검색이라... 빙이 그런 검색 능력에도. 접지 않은 이유가 소송용인가?
태양별왕자
2024/10/24 11:35
저땐 낭만이었네
소서리
2024/10/24 11:35
저게 호제던의 아폴로구나.