시간에 따른 단어 (인문학)


'사랑'이란 단어가 서로 다른 문화권에서 얼마나 자주 사용되는지 알기 원한다고 하자.

각 문화에 따라 중요하거나 재미있는 내용이 책에 기록된다고 한다고 생각해서 책 한권에 있는 '사랑'이란 단어를 센다면, 얼마나 시간이 걸릴 것인가?

하물며 많은 양의 책은 어떻게 셀 것인가?


구글의 ngram viewer 서비스는 한 단어 구가 시간에 따라 어떻게 사용되었는지 보여준다.

구글은 이를 위해 많은 책을 스캔해왔었다.


'사랑'이란 대신 다른 단어를 넣어보자. 어떤 단어가 시간에 따라 증가되거나 감소되었는가?

큰 변화를 일으킨 단어가 있었는가?

https://books.google.com/ngrams/graph?content=love&year_start=1800&year_end=2000&corpus=15&smoothing=3&share=&direct_url=t1%253B%252Clove%253B%252Cc0


만약 사람들에게 오늘 신문을 주고 제일 많이 나온 단어를 찾으시오 라고 한다면,

그들의 시간을 줄이기 위해서 어떤 과정을 사용할 것인가?

만일 그들에게 오늘 뉴스를 몇 문장으로 요약하라고 요청한다면,

오늘 가장 중요한 일에 대한 정보를 주기위해서 어떤 지침을 선택할 것인가?

일년동안 가장 뉴스를 요약하라면 어떻게 할 것인가?



책에서 단어를 찾는 과정은 인터넷에서 단어를 찾는 과정과 비슷합니다.

관련된 단어를 검색해서 마우스를 스크롤 하죠.

이러한 알고리즘 과정은 많은 정보 중에서 자료를 찾을 수 있도록 해줍니다.

이에 대해 좀더 알고 싶으시면 다음의 아이디어를 참고하세요.


찾고 싶은 단어를 다중으로 입력하세요.

위 ngram에 "love money"를 넣어서 검색해봅니다.

그리고 love or money"를 넣어서 그 둘의 관계가 우연의 일치인지, 중요한 사건인지, 문화의 변동인지에 대한 가설을 만들 수 있습니다.

행복, 슬픔과 같은 복잡한 감정도 추가로 검색할 수 있습니다.

반대로 접근해 보세요. 특정 중요한 사건을 염두에 두고 검색어를 바르게 사용했는지 살펴보세요.

특성 시기에 언급이 많은 용어가 그 검색어가 될 수 있습니다.

어떤 매체가 여러분의 문화를 가장 잘 대표할까요? 뉴스, 책, 음악, 영화, 문자, 유투브 영상, 또는 무엇일까요?


더 자세한 정보는 인터넷에서 ngram, culturomics, Zipf's law, Shakespeare authorship, Google zeitgeist를 검색해 보세요.

만일 학생들과 이 활동을 한다면 이 활동 관련 교육기준을 참고할 수도 있습니다.