프로그래밍/IT이야기

포토신스를 통해서 보는 미래의 검색엔진

당근천국 2014. 1. 28. 15:00

프리젠테이션 관련 정보를 찾다가 우현히 찾은 TED의 강연입니다.

 

 

포토신스는 이미 마이크로 소프트에서 무료로 제공하고 있습니다.

(참고 : 포토신스 )

 

포토신스

포토신스의 역활은 의도하여 찍은 사진이던 의도하지 않았던 사진이던 모아서 3D공간을 만들어 줍니다.

다음 셈플을 보시면 이해하시기 편하실 겁니다.(실버라이트를 설치해야 작동합니다.)

 

 

셈플만 보면 일반적인 로드뷰 처럼 보이지만 3공간을 구현할때 로드뷰를 의도하고 찍은 사진들이 아니여도 사용이 가능하다는 장점이 있습니다.

(직접 써보질 않아서 어느 정도 수준의 사진까지 가능한지는 모르겠습니다.

강연의 내용으로 보아 사진의 양만 충분하다면 웬만큼 막혀있어도 가능할듯하네요.)

 

 

빅데이터가 활용되는 과정

어찌됬건 여기서 중요한 것은

"의도하지 않은 사진들을 이용하여  원하는 사진을 만들어 낸다"

는 것입니다.

 

'2D공간에서는 여러장의 사진을 수집한후 포토샵같은 툴로 확대/축소, 왜곡, 추론, 패턴 등을 이용하여 수작업으로 구현해도 되고 개념 자체는 예전부터 있었는데 뭐가 특별 한가?'

라는 의문을 가질 수 있겠습니다만 이러한 작업은 빅데이터 시대를 맞아 규모가 상상을 초월 할 정도로 커졌습니다.

 

 

TED의 강연 5분 쯤에 나오는 장면을 보시기 바랍니다.

 

 

이 장면은 빅데이터를 분석하고 활용하는 것을 시각화한 것이라고 보시면 됩니다.

노틀담 대성당의 완전한 3D 이미지를 만들기 위해 수천 장의 사진을 가지고 자르고 붙이고 하는 것이죠.

 

여기서 우리는 중요한 사실을 한가지 발견할 수 있습니다.

"연관성이 별로 없다고 생각한 많은 데이터를 가지고 원하는 양질의 데이터를 만들 수 있구나"

 

 

미래의 검색엔진

이제야 본론입니다 ㅎㅎㅎ

 

빅데이터는 데이터양이 너무 많아서 수작업으로는 분석할 수 없습니다.

결국 어떤 식으로든 자동화를 해야 하고 그 결과가 위와 같은 프로그램들입니다.

 

그렇다면 이런 분석방법을 검색엔진에 적용한다면 어떻게 될까요?

 

 

빅데이터 활용

빅데이터 활용법은 '통계'나 '패턴 분석'같은 이전부터 사용하던 기술들과 다를 것이 없었습니다.

단지 규모가 커졌을 뿐이죠.

 

규모가 커지니 연관된 데이터들도 많이 보이고 이런 데이터들을 엮어보니 새로운 연결고리가 되거나 잘못된 연결고리가 없어지면서 양질의 데이터가 됩니다.

 

 

검색결과를 만들어 낸다.

여기서 '만들어 낸다'의 의미는 생성(生成)의 의미입니다.

 

지금까지의 검색엔진들은 다른 사람들이 만들어놓은 데이터를 출력하는 데 급급했습니다.

기껏해야 '사용자 패턴 분석'(여기에 빅데이터를 적용할지 말지 문제도 있긴 하죠.)이나 연관성 있어 보이는 검색결과를 나열하는 것이 전부죠.

 

하지만 '포토신스'같은 기술을 일반적인 데이터에 적용한다면 검색엔진 자체가 검색결과를 생성할 수 있게 됩니다!!

이것은 '시리'와 같은 자연어 처리 기법과 비슷하지만 좀 더 능동적이고 광범위하다고 생각하시면 됩니다.

 

검색결과아니라 답변이다.

예를 들어 봅시다.

우리가 내일 도봉산으로 나무를 심으러 가면 어떨지에 대해 검색을 한다고 해봅시다.

우리는 검색어로

"도봉산 나무심기"

를 적었습니다.

 

지금의 검색엔진은 다음과 같은 결과를 줍니다.

 

 

하지만 미래의 검색엔진은 다음과 같은 결과를 주게 될 것입니다.

 

 

내일은 나무 심기 좋은 날씨로 추천하는 나무는 '소나무'입니다.

10시부터 16시 사이에 산 입구에서 300m 정도 올라간 지점이 좋습니다.

 

이러한 데이터를 만들기 위해서 다음과 같은 데이터들이 사용되었을 것입니다.

내일(2014.01.08) - 2000~2014의 1월 1일 ~ 1월 15일 시간별 날씨 통계

날씨 통계에 따른 도봉산 등산 결과 - 블로그 정보 분석

날씨 통계에 따른 도봉산 나무 심기 결과 - 블로그 정보 분석

날씨 통계에 따른 도봉산 나무 생육 - 전문기관 가중치 + 블로그 정보 분석

나무 심기 적절한 위치 찾기 - 정부 발표 분석, 논문분석

찾은 적절한 위치를 가지고 도봉산 지도에 적용하여 적절한 위치 선정 - 지도에 표시

 

이 정도 정보를 수작업을 하기 위해서는 꽤 많은 검색을 해야 합니다.

그렇다고 이러한 정보가 한군데 모여있는 것도 발견하기가 쉽지 않죠.

 

한계

 

그렇다고 사용자의 의도대로 완벽하게 파악할 수 있는 시스템은 나오지 않을 것입니다.

(메트릭스가 아닌 다음에야....-_-a)

하지만 어느 정도 근접한 정보들을 줄 수는 있죠.

 

물론 검색엔진에 나의 많은 정보를 자세하게 줄수록 의도에 맞는 결과가 나올 확률이 높습니다.

 

마무리

결론은 검색엔진도 언젠가는 저렇게 될 것이라는 뻔한 이야기입니다.

 

실제로 구글은 구글나우를 통해 저런 것들을 시도하고 있죠.

일정표를 작성해 놓으면 일정에 따라 이것저것 구글나우에서 추천이 들어올 것입니다.

 

이런 것을 어떤 사람들은 '정보통제'라는 단어를 쓰더군요.

악용할 소지가 없는 건 아니지만 마냥 거부할 순 없죠.

대부분 전자장비가 도청이 가능한데 그렇다고 아무런 통신장비 없이 사는 것이 쉬운 건 아니니까요.

 

어찌 됐건 검색엔진은 결국 '사용자의 의도를 얼마나 잘 파악하느냐'가 정확도의 기술이기 때문에 아침에 일어나면 창문에 이것저것 알림을 표시해주는 것이 멀지 않은 이야기라는 것이죠 ㅎㅎㅎ