상세 컨텐츠

본문 제목

일본의 퍼블릭 도메인 전자 도서관, 아오조라 문고 소개

본문

이번에 알아 볼 대상은, 일본의 웹사이트 아오조라 문고(青空文庫, あおぞらぶんこ, 아오조라 분코)입니다. [링크=아오조라 문고(여기를 누르면 이동)]



이 사이트는 퍼블릭 도메인(public domain)이 된 글, 즉 저작권이 소멸된 글을 모아두는 사이트입니다. 일본의 책들을 대상으로 하여 모아두는 사이트인데, 옛날 일본 글을 찾을 때 유용하게 사용할 수 있습니다. 저는 일본어를 공부하던 중, 옛날 일본 소설에 관심이 생겨서 찾아보던 중 알게 되었습니다. 일본어 공부 중에 이 사이트를 알게 되었다면, 대개 저와 비슷한 목적으로 이 사이트를 찾으셨을 겁니다.


퍼블릭 도메인이란?


계속 언급되겠지만, 퍼블릭 도메인이란 저작권이 소멸된 저작물을 의미합니다. 글·그림·사진 등 다양한 형태의 저작물을 모두 이야기하지만, 이 글에서 중점적으로 다룰 것은 글입니다. 저작권의 보호에 관해서는 각 국가의 저작권법에 관련 규정이 있습니다만, 여러 국가가 가입한 베른 협약에 그 대강의 내용이 규정되어 있습니다.


특히 저작권의 보호기간에 관해서는, 베른 협약 제7조 제1항에서 "저작자의 생존기간과 그의 사망 후 50년"으로 규정하고 있지만, 베른 협약 제7조 제6항에서는 "동맹국은 전항들에서 정한 기간을 초과하여 보호기간을 부여할 수 있다."라고 하여 저작권 보호 기간을 국가마다 다르게 규정할 수 있도록 정해두었습니다. [출처=국가법령정보센터 문학·예술적 저작물의 보호를 위한 베른협약 조약 제1349호]


아오조라 문고에서는 베른협약과 일본의 저작권법(著作権法)에 의해 보호기간이 지난, 즉 저작권이 소멸된 글들을 모아 두고 있습니다. 저작권이 소멸되었다는 것은, 저나 여러분이 그 글들을 마음껏 활용할 수 있다는 것을 의미합니다. 제가 저의 블로그에 일본어 공부 소재로서 올려도 되고, 책으로 출판해서 돈을 벌어도 됩니다. 다만 저작인격원은 저자 사후에도 계속 보장이 되기 때문에, ①자신이 쓴 글인 것처럼 하거나 ②원작자의 사회적 명성이 저해될 수 있는 내용으로 편집해서는 안 됩니다. 이런 정도의 제약 사항만 지킨다면, 그 글을 마음껏 사용할 수 있는 겁니다.


이 글을 보시는 여러분도 가장 쉽게 보실 수 있는 예시로는 아서 코난 도일(Arthur Conan Doyle)이 쓴 셜록 홈즈(Sherlock Holmes) 시리즈가 있습니다. 셜록홈즈 시리즈의 저자 아서 코난 도일은 영국 사람이고 1930년에 죽었습니다. 코난 도일의 작품은 이미 저작권이 소멸되었고, 책을 내거나 2차 창작물(드라마, 영화, 게임 등)을 만드는데 누구의 허락도 필요가 없습니다. 그래서 서점에서 찾아보시면 셜록홈즈 번역본이 굉장히 많다는 걸 아실 수 있습니다. 라이센스 비용이 0원이기 때문에, 출판사에서 부담 없이 책을 내는 겁니다.


아오조라 문고는 이러한 저작권이 소멸된 글들을 모아서 많은 사람들이 자유롭게 이용할 수 있도록 공개하고 있습니다. 다른 나라에도 유사한 취지의 인터넷 사이트가 있는데, 인터넷 아카이브(Archieve, 거의 영어), 구텐베르크 프로젝트(Project Gutenberg, 거의 영어)위키문헌(wikisource, 영어판), 위키문헌(한국어판) 등이 있습니다. 이 중 인터넷 아카이브에는 수 백만 개의 책·영상·음악·그림이 모여 있어서, 자료가 정말 많습니다. 이 글에서 소개드리는 아오조라 문고는 분야도 거의 책에 한정되어 있고, 수록 작품도 약 15,000개(2018년 3월 6일 기준)에 불과하지만, 일본에서는 가장 큰 사이트이고 유명한 자료는 많이 있는 편이기 때문에 옛날 일본 글을 찾으실 때에는 가장 먼저 들르시게 될 사이트가 될 겁니다.




위 소개만으로도 아오조라 문고가 어떤 사이트인지 아실 수 있을 겁니다만, 좀 더 자세히 알고 싶으신 분들을 위해 위키피디아 일본어판의 문서를 번역해서 함께 올립니다. 아래 글은 일본어 위키피디아 青空文庫 항목 2018년 2월 14일(수) 14:31 버전을 번역한 것입니다. 해당 위키피디아 문서는 그 문서의 하단에 기록된 것처럼 CC BY-SA 3.0 라이센스(저작자표시-동일조건변경허락 3.0 Unported) 하에서 사용이 가능하며, 이에 따라 아래 문서도 같은 라이선스로 이용하실 수 있습니다.


참고로, 고유명사의 표기는 대체로 국립국어원의 외래어 표기법을 따랐습니다. 다만 나쓰메 소세키와 나츠메 소세키처럼 서로 다른 표기가 사용되기도 하는 경우에는 "나쓰메 소세키(나츠메 소세키, 夏目漱石)"처럼 괄호에 함께 표기하였습니다. 


개요

아오조라 문고는, 저작권이 소멸한 작품이나 저자가 허락한 작품의 텍스트를 공개하는 인터넷 전자도서관이다. 도미타 미치오(토미타 미치오, 富田倫生), 노구치 에이지(野口英司), 야마키 미에(八巻美恵), 란무로 사티(らんむろ・さてぃ) 4명이 발족하였으며, 1997년 2월에 설립되었다. 일본에서 저작권이 소멸한 작품을 온라인에 공개하는 활동의 선구자이며, 2016년 기준 연간 접속 횟수는 총940만 건 이상이라고 한다. 2018년 3월 6일 현재 14647개의 작품을 수록중이다.


수록 작품은 자원 봉사자들이 업로드한 것으로서, JIS X 0208 한자의 범위에서 아오조라 문고 형식의 텍스트 파일이나 HTML로 전자화되어 있다. 또한 "아오조라 문고 수록 파일의 취급 규준"에 따라 자유롭게 이용이 가능하므로, 수록 작품은 PC뿐만 아니라 PDA나 휴대전화 등의 환경에서도 이용 가능하다. 저장 형식이 텍스트 파일이라는 점에서 큰 글씨로 인쇄하거나 텍스트 리더 소프트웨어를 이용하는 등, 시각장애인을 위한 이용도 기대된다.


아오조라 문고 자체적으로는 열람 소프트웨어를 개발하거나 제공하지는 않지만, 전자사전이나 iPhone 등에 서드 파티(Third Party) 소프트웨어가 개발되어 있다.


수록작품

저자 사망 후 50년이 경과하여 일본 내에서 저작권이 소멸한 작품, 즉 메이지 시기(1868~1912)나 쇼와 시기(1926~1989) 초기의 작품이 장서의 대부분을 차지하고 있다. 외국어 작품의 번역물이나, 저자가 직접 열람을 인정한 현대 작품도 있다. 장르는 정치부터 취미까지 매우 다양하지만, 비교적 문학 작품(시대소설·탐정소설 등 오락 작품도 포함)이 많다. 저명한 작품이 모두 있다고는 할 수 없지만, 일본어 작품은 상당히 충실히 갖추어져 있다 (외국어 작품은 번역자의 저작권이 소멸되지 않은 경우가 많아, 아직 그 수가 적다). 또한, 비주류 작품을 보존·소개한다는 장점도 있다. 작품의 전자화는 계속 진행되고 있으며, 2011년 3월 15일에는 수록작품이 1만점을 넘겼다. 모리 오가이(森鴎外), 나쓰메 소세키(나츠메 소세키, 夏目漱石)·아쿠타가와 류노스케(芥川龍之介) 등 오래된 작가의 작품부터, 나카지마 아쓰시(나카지마 아츠시, 中島敦, 1942년 사망)·다자이 오사무(太宰治, 1948년 사망)·하야시 후미코(林芙美子, 1951년 사망)·미야모토 유리코(宮本百合子, 1951년 사망)·호리 다쓰오(호리 타츠오, 堀辰雄, 1953년 사망)·사카구치 안고(坂口安吾, 1955년 사망)·다카무라 고타로(타카무라 코타로, 高村光太郎, 1956년 사망)·나가이 가후(나가이 카후, 永井荷風, 1959년 사망)·요시카와 에이지(吉川英治,1962년 사망) 등 비교적 최근 작가들의 작품도 있다.

운영

아오조라 문고는 자원봉사자들에 의해 운영되고 있으며, 열람은 무료이다. 사이트 개설 당시의 서버는 보이저로부터 제공받았다. 1998년부터 1999년에 걸쳐서 도미타 미치오 등이 작업 규칙과 매뉴얼을 작성하였다.


입력과 교정은 자원봉사자에 의해 이루어진다. 입력은 원본을 보면서 직접 입력하는 방식과, 스캐너를 이용하는 방법으로 이루어진다. 작품을 입력하는 "입력자"와 입력된 작품을 교정하는 "교정자"는 별도의 봉사자가 담당한다. 작품이 입력된 후에도, 교정자가 교정 예약을 하기 전까지는 작업 상태가 "교정 대기중(校正待ち)"이 되며, 작업이 중단된다. 즉 입력자인 자원봉사자가 작품을 입력하더라도, 교정자인 자원봉사자가 교정 예약을 하여 교정 작업을 완료하지 않는다면 작품을 공개하는 것은 불가능하다. 그래서 입력이 완료되어도 작업 상태가 "교정 대기중"인 채로 멈추어 있는 작품이 늘고 있다. 이는 입력자에 비해 교정자가 부족하기 때문이며, 아오조라 문고가 발족한 초기부터 겪고 있는 문제이기도 하다. 교정자가 부족한 문제에 대해서는, 작품의 교정 작업 없이 공개하는 안이나 입력자에 의한 교정을 인정하는 안이 제출되어 있지만, 지금까지는 해당 안이 채택되지 않고 있다. 대신 기부금을 통한 "유상교정"이 2011년(헤이세이 23년) 12월 16일에 공개된 작품부터 시작되었다.


2013년 8월에 창립자 중 한 명인 도미타 미치오가 사망한 것을 계기로, 아오조라 문고에 대한 지속적 지원을 목적으로 하는 "책의 미래 기금(本の未来基金)"이 설립되었다. 하지만 2015년에는 엔지니어 없이 서버를 운영하기도 하였으며, 서버 자체의 노후화도 문제가 되었다. 이를 위해 2015년 5월에 "'Code for 青空文庫' 아이디어 마라톤"이 개최되었고, 이후의 시스템 운영에 대해 의견 교환을 가졌다. 이후에는 시스템 관리와 코드 개수 등을 수행하는 "aozorahack" 프로젝트가 시작되었다.

아오조라 문고 형식(青空文庫形式)

텍스트 파일을 아오조라 문고에 수록할 때, 텍스트 파일이 따라야 하는 서식을 '아오조라 문고 형식(青空文庫形式)'이라고 한다.


아오조라 문고 형식은 텍스트 파일로서 많은 환경에서 읽을 수 있도록 규격화되어 있다. 가능한 한 원본에 충실한 재현을 목표로 하지만, 줄바꿈이나 삽화 등의 정보는 원칙적으로 포함하지 않는다.


아오조라 문고 형식에 대응하는 텍스트 뷰어나 텍스트 에디터도 있다. 루비, 즉 한자 등의 읽는 방법을 표시하기 위해 글자 위(가로쓰기)나 글자 옆(세로쓰기)에 표기하는 글자의 재현도 가능하고, 방점의 재현도 가능하다. 또한 이러한 텍스트 뷰어는 본래 아오조라 문고 형식에 포함되지 않는 삽화 정보를 삽입하거나, 세로쓰기로 표시하는 것도 가능하며, 텍스트를 읽기 쉽도록 여러 기능을 갖추고 있다. 이러한 텍스트뷰어는 유료·무료로 여러 가지가 존재한다.



루비의 표기

루비의 표기는 |과 《》로 표현된다. 루비를 《》로 감싸거나, |로 루비가 걸릴 문자열을 특정하는 것은 시각장애자독서지원협회(視覚障碍者読書支援協会, BBA)의 원문 입력 방식에 맞춘 것이다.


青空|文庫《ぶんこ》

이렇게 입력하면, "ぶんこ"라는 루비가 "文庫"에 붙어 있다는 것을 나타낸다.


本日は晴天《せいてん》なり

이처럼, 가나와 한자 사이에 |가 들어가는 경우는 |를 생략하는 것도 가능하다.


|ブルースカイ《青空》

이와 같이 가나에 루비를 붙이는 것도 가능하다.


입력자 주

원본의 재현을 보조하기 위해, 입력자 주 형식도 정해져 있다.


これ[#「これ」に傍点]を、使って下さい。

喉を掻き※[#「てへん+劣」、第3水準1-84-77]《むし》って

이렇게 방점을 넣거나, JIS X 0208한자에 포함되지 않는 구 한자 또는 상용한자표에서 벗어나는 한자 등을 설명할 때 사용되는 경우가 많다.


문제

저작권 보호 기간 연장 문제

2003년 이후, 미국 정부는 "연차개혁요망서(年次改革要望書, The U.S.-Japan Regulatory Reform and Competition Policy Initiative)"를 통해 일본 정부에 대해 저작권 보호기간을 "개인의 경우 사후 70년, 법인의 경우 공표 후 95년"으로 연장할 것을 요청하였다. 이를 받아들여 문화청은 2007년 중에 문화심의회 저작권분과회에서 결론을 내릴 것이라고 표명하였다. 보호기간을 연장하는 법개정이 실제로 이루어진다면, 아오조라 문고는 개정법 실시로부터 최소 20년간은 신규 작품 등록이 어려워질 우려가 있으므로, 2005년 1월 1일부로 반대 성명을 공표하였다. 또한 2007년 1월 1일부터는 같은 취지의 청원 서명운동을 개시하였다.


일본 밖에서는 에릭 엘드레드(Eric Eldred)나 호주의 "프로젝트 구텐베르크"의 활동이 저작권 보호기간 연장에 의해 어려워지고 있다. 아오조라 문고가 연장 반대를 표명하며, 청원 서명 운동을 벌이고 있는 것도 이러한 전례를 목격했기 때문이다.


2015년 10월 5일에 대략적인 합의에 도달한 환태평양 경제 동반자 협정(TPP) 중에 저작권 보호기간 연장에 관한 조항이 포함되어, 타결 결과로서 법개정이 이루어지면 아오조라 문고의 활동에도 영향이 미치므로, 이후의 운영을 걱정하는 의견도 나오고 있다.



ケヶ문제

아오조라 문고의 작업 규정에는, 원본의 "ケ(케, 큰 글씨)"를 "こ·か·が(코·카·가)"로 읽을 때에는, "ヶ(케, 작은 글씨)"로 바꾸어 입력하도록 방침이 정해져 있다. 예를 들면, 원본에 霞ケ関(かすみがせき, 카스미가세키)라고 되어 있는 경우에는, ケ를 が(가)로 읽으므로 "霞ヶ関"라고 입력한다. 또한, 아오조라 문고 형식의 파일 말미에 "※원본은, 물건을 셀 때나 지명 등에 사용되는 'ヶ(작은 글씨, 区点番号5-86)'를 크게 적고 있습니다."라고 주석을 달아야 한다.


한편, 작업 규정의 방침으로는 원본의 문장은 자의적으로 변경하지 말고, 가능한 한 원본 그대로 입력하도록 하는 규정도 있어서, "ケ(큰 글씨)"를 "ヶ(작은 글씨)"로 바꿔 적지 않는 편이 좋다는 의견도 있다. 현행 작업 규정에 따르자는 측과 이에 반대하는 측의 논쟁이 있지만, 아직 결론은 나지 않았다.



Unicode문제

아오조라 문고에는 텍스트의 문자부호화 방식으로 Shift_JIS를 채용하고 있다. 이를 위해, 텍스트를 입력할 때 다음 예시와 같은 한자 변환이 이루어져 있다.


森鷗外→森鴎外、内田百閒→内田百間、大倉燁子→大倉※[#「火+華」、第3水準1-87-62]子


한자 변환을 회피하기 위해 유니코드를 채용하자는 목소리도 있지만, 포섭분리를 위한 재검토를 이미 공개된 모든 텍스트에 대해서도 수행하지 않으면 Unicode화는 어렵다고 주장하는 운영 측과, 이미 공개된 텍스트는 보류하고 신규 공개 텍스트부터 Unicode화 해야 한다고 주장하는 측의 대립이 있다.

반응형

관련글 더보기