본문 바로가기
스포츠 & 게임

영화 추천 장치

by AI특이점 2024. 3. 1.
반응형

요 약

 

영화 추천 장치는 사용자의 단말기로부터 전송된 복수의 영화 관련 항목 사이의 선호도 를 Fuzzy-AHP(Analytical Hierarchy Process)를 이용하여 분석하여 상기 영화 관련 항목의 선호우선순위를 도출 하는 사용자 정보 수집부; 네티즌들의 단말기들에 의하여 작성된 영화 평가 텍스트 데이터를 수집한 뒤 상기 영 화 평가 텍스트 데이터를 LSTM(Long Short Term Memory) 언어 모델로 학습하여 상기 영화 관련 항목에 해당되는 학습 결과 시퀀스 데이터(sequence data)를 도출하는 영화 평가 학습부; 상기 선호우선순위에 따른 상기 영화 관 련 항목에 해당되는 상기 학습 결과 시퀀스 데이터로부터 영화 제목을 추출하여 상기 사용자의 단말기로 영화 추 천 결과를 제공하는 영화 추천부; 및 상기 사용자의 개인정보, 상기 영화 관련 항목, 상기 선호우선순위, 상기 학습 결과 시퀀스 데이터 및 상기 영화 추천 결과를 저장하는 데이터베이스를 포함한다.

 

 

기 술 분 야

 

영화 추천 장치에 관한 것이다.

 

 

 

배 경 기 술

 

현재 우리 사회는 인공지능 중심으로 변화하고 있다. 새로운 기술 트렌드 변화를 위해 다양한 기계학습 기법을 적용하고 있으며, 5G 시스템을 통해서 빠르게 접목할 수 있도록 개인화 서비스를 향상시키고 있다.

 

이러한 변화는 여러 사용자와 네트워크 서비스를 연결할 수 있게 오픈 그래프를 형성하게 되었으며, 사용자의 미디어 플랫폼 참여율을 높일 수 있었다. 

 

추천 시스템은 사용자의 미디어 플랫폼 참여율을 높일 수 있는 대표적인 시스템으로, 사용자의 행동 패턴을 이 용하여 맞춤형 콘텐츠 또는 연관성이 높은 콘텐츠를 추천하는 시스템을 말한다. 현재 추천 시스템은 협업 필터링(Collaborative Filtering) 방식과 기계학습 방식을 결합하는 하이브리드 형태 의 추천 시스템과 여러 상황에 따른 서비스를 제공하기 위한 상황 인식(Context-awareness) 방식의 추천 시스템 을 제안하고 있다.

 

영화 추천 시스템의 경우에는 협업 필터링 방식보단 기존의 방식에 기계학습 방식을 결합하여 영화를 추천하거 나 영화 리뷰 데이터로 감성 분석을 적용하여 사용자가 선호하는 영화의 감성과 유사한 장르를 추천하는 시스템 을 제안하고 있다.

 

그러나 현재 영화 추천 시스템의 방식은 사용자의 심리적인 고정관념을 증폭시켜 사용자가 선호하는 콘텐츠보단 시스템 공급자가 원하는 방향으로 콘텐츠를 추천하고 있다는 문제점이 있다. 또한 사용자의 관심사와 취향이 변해도 추천 시스템에 반영하지 못하고 있으며, 사용자마다 콘텐츠를 선호하는 정도가 다르기 때문에 이를 명확하게 표현할 수 없어 사용자의 선호도에 대한 불확실성이 높다는 문제점이 있다.

 

 

해결하려는 과제

 

영화 추천 장치는 사용자가 선호하는 영화 콘텐츠를 추천하기 위한 것이다. 영화 추천 장치는 사용자의 관심사와 취향의 변화를 반영하여 사용자에게 영화 콘텐츠 를 추천하기 위한 것이다. 영화 추천 장치는 사용자에 따른 영화 콘텐츠의 선호 정도에 대한 불확실성을 낮추기 위한 것이다. 

 

 

해결 수단

 

사용자의 단말기로부터 전송된 복수의 영화 관련 항목 사이의 선호도를 FuzzyAHP(Analytical Hierarchy Process)를 이용하여 분석하여 상기 영화 관련 항목의 선호우선순위를 도출하는 사용 자 정보 수집부; 네티즌들의 단말기들에 의하여 작성된 영화 평가 텍스트 데이터를 수집한 뒤 상기 영화 평가 텍스트 데이터를 LSTM(Long Short Term Memory) 언어 모델로 학습하여 상기 영화 관련 항목에 해당되는 학습 결 과 시퀀스 데이터(sequence data)를 도출하는 영화 평가 학습부; 상기 선호우선순위에 따른 상기 영화 관련 항 목에 해당되는 상기 학습 결과 시퀀스 데이터로부터 영화 제목을 추출하여 상기 사용자의 단말기로 영화 추천 결과를 제공하는 영화 추천부; 및 상기 사용자의 개인정보, 상기 영화 관련 항목, 상기 선호우선순위, 상기 학 습 결과 시퀀스 데이터 및 상기 영화 추천 결과를 저장하는 데이터베이스를 포함하는 영화 추천 장치가 제공된 다.

 

상기 영화 평가 학습부는 상기 수집된 영화 평가 텍스트 데이터를 하나의 파일로 병합하고, 상기 병합된 파일에 존재하는 특수 문자를 제거하는 전처리를 수행할 수 있다. 상기 영화 평가 학습부는 상기 전처리된 영화 평가 텍스트 데이터를 문장의 구성단위인 토큰(token)으로 분리하 고, 상기 토큰으로 분리된 영화 평가 텍스트 데이터를 고정 길이의 수치형 텐서(tensor)로 변환하며, 상기 LSTM 언어 모델을 통하여 상기 고정 길이의 수치형 텐서에 대한 학습을 수행할 수 있다. 

 

상기 영화 평가 학습부는 상기 LSTM 언어 모델로 상기 영화 평가 텍스트 데이터의 현재 시퀀스의 단어를 학습하 면서 통계적으로 다음 시퀀스의 단어를 예측하여 상기 학습 결과 시퀀스 데이터를 도출할 수 있다. 상기 영화 평가 학습부는 상기 현재 시퀀스의 단어로서 상기 영화 관련 항목을 사용하고, 상기 영화 관련 항목 의 다음 시퀀스의 단어를 통계적으로 예측하여 상기 학습 결과 시퀀스 데이터를 도출할 수 있다.

 

상기 영화 관련 항목의 단어들 중 적어도 하나가 상기 학습 결과 시퀀스 데이터의 첫번째 단어일 수 있다. 상기 영화 추천부는 상기 영화 제목에 링크된 영화 상세 정보를 상기 데이터베이스로부터 읽어들어 상기 사용자 의 단말기로 제공할 수 있다.

 

 

효과

 

영화 추천 장치는 단순한 사용자의 행동 패턴이 아닌 관심사를 실시간으로 수집하여 이를 반영할 수 있는 Fuzzy-AHP(Fuzzy-Analytic Hierarchy Process)와 LSTM(Long-short Term Memory Network) 언어 모델을 이용한 영화 추천을 제공할 수 있다.

 

 

 

구체적인 내용

 

 

영화 추천 장치는 사용자 정보 수집부, 영화 평가 학습부, 영화 추천부 및 데이터베이스를 포함한다. 영화 추천 장치는 컴퓨팅 장치로서 하드웨어 및 소프트웨어에 의하여 구현될 수 있다. 영화 추천 장치는 프로세싱부, 메모리부, 표시부 및 통신부를 포함할 수 있 다.  프로세싱부는 영화 추천 장치의 전반적인 동작을 제어하며, 사용자 정보 수집, 학습, 영화 추천 및 정보의 저장과 같은 영화 추천의 과정을 처리할 수 있다.

 

프로세싱부

 

CPU(Central Processing Unit), AP(Application Processor) 및 마이크로프로세서일 수 있으나 이에 한정되는 것은 아니다.

 

메모리부

 

영화 추천 장치의 동작에 필요한 소프트웨어 및 데이터를 저장할 수 있다. 앞서 언급된 데이터베이스는 메모리부에 저장될 수 있다. 메모리부는 버스(bus)를 통하여 프로세싱부와 통 신을 수행할 수도 있고, 통신부를 통하여 원격에서 프로세싱부와 통신할 수도 있다. 메모리부는 비휘발성 메모 리를 포함할 수 있다. 예를 들어, 메모리부는 ROM, 하드디스크, 광학디스크(예를 들어, DVD, Blu-ray disk 등), SSD(Solid State Disk), USB 메모리, SD 카드 메모리 등을 포함할 수 있으나 이에 한정되는 것은 아니다. 메모 리부 외에 영화 추천 장치는 RAM과 같은 휘발성 메모리도 포함할 수 있다.

 

 

표시부

 

영화 추천 장치의 동작을 표시할 수 있다. 표시부는 CRT, LCD, LED, OLED 등 을 포함할 수 있으나 이에 한정되는 것은 아니다.

 

통신부

 

 영화 추천 장치와 외부의 컴퓨팅 장치 사이의 유무선 통신을 수행할 수 있다. 통신부는 근거리 통신 모듈 및 원거리 통신모듈을 포함할 수 있다. 근거리 통신 모듈은 블루투스, NFC(Near Field Communication), UWB(Ultra Wide Band) 등일 수 있으나 이에 한정되는 것은 아니다. 원거리 통 신 모듈은 인트라넷, 인터넷이나 이통통신망과 같은 유무선 네트워크에 접속하여 통신할 수 있다.

 

사용자 정보 수집부

 

사용자의 단말기로부터 전송된 복수의 영화 관련 항목 사이의 선호도를 Fuzzy-AHP(Analytical Hierarchy Process)를 이용하여 분석하여 영화 관련 항목의 선호우선순위를 도출한다. 사용자의 단말기는 PC, 랩탑 컴퓨터, 스마트폰, 태블릿 PC 등일 수 있으나 이에 한정되는 것은 아니다. [0036] Fuzzy-AHP는 객관적으로 평가하기 위한 콘텐츠나 항목(Item)에 대해 여러 평가 기준을 적용하고, 이를 판단하는 의사결정 방법론을 말한다. 평가 기준을 평가하기 위한 명확한 수치나 언어적인 표현 방법은 애매하고, 부정확 하며 주관적이기 때문에 Fuzzy 이론을 적용하여 이를 보완하고 있다.  예를 들어 ‘이 영화의 평점이 좋다’라고 하면 얼마만큼 이 영화를 선호하는지 관객들마다 다르며, 이를 수치 로 표현했을 때 ‘평점 4점’이라고 정의할 수도 있으며 ‘평점 3.5점’이라고 정의할 수도 있다. Fuzzy 이론은 이와 같은 문제점을 해결할 수 있는 주관성을 도입한 집합론이라고 표현하기도 한다.

 

Fuzzy-AHP를 진행하기 위한 의사결정 단계는 다음과 같다.  (1) 평가하기 위한 콘텐츠나 항목에 대한 평가 기준을 통해 계층 구조를 구성한다. 계층 구조를 구성할 때 의사결정의 목표에 따라 평가 기준과 평가 요소 등을 계층구조에 종속시키며, 목표에 영향을 미치는 불확실한 정보나 부정확한 요인들로 계층을 도 3과 같은 형태로 구성할 수 있다.

 

계층 구조는 사용자가 영화를 선택할 때 선호하는 요인들로 구성되었으며, 각 선호 기준은 영화가 흥행 하기 위한 요소들로 구성되었다. 예를 들어, 선호 기준은 영화 흥행에 중요한 시놉시스, 예고편, 영화를 본 관 객의 리뷰와 평점을 포함할 수 있다. 또한 영화 장르와 국가별 영화에 따라 기호가 다르게 나타나므로 계층 구조에 영화의 국가와 장르가 포함될 수 있다. 박스 오피스의 순위 또한 사람들의 관심을 끌기 때문에 영화가 흥행하는데 영향이 크므로 .박스 오피스가 계층 구조에 포함되었다.

 

이와 같은 영화 관련 항목의 계층 구조는 도 3에 한정되는 것은 아니다. (2) 평가 기준들과 평가 요소들 간의 쌍대비교를 진행하여 쌍대비교 행렬을 구성한다. 쌍대비교 행렬을 구성하 기 위해서 각 계층에 있는 관련 평가 기준들과 평가 요소들 간의 일대일 평가가 진행된다. 이를 위하여 사용자 의 단말기는 도 4의 (a)와 같은 사용자 인터페이스를 표시할 수 있다. 사용자의 단말기는 사용자의 조작에 따라 입력된 평가 요소들 사이의 선호도를 본 발명의 영화 추천 장치로 전송하며, 이에 따라 사용자 정보 수집부 는 상기 선호도를 수집할 수 있다.

 

일대일 평가 방법은 9점 척도 방법을 따르며, 그 방법은 도 4의 (b)와 같다. 여기서 퍼지 수(Fuzzy Numbers)란 소속 정도에 따른 소속 함수를 근처의 수와 비슷하게 표현하는 방법을 말할 수 있다. 퍼지 수는 사 다리꼴 형태, 가우스 분포 형태 등 여러 가지가 있는데  삼각 퍼지 수(Triangular Fuzzy Numbers)가 사용되었으나 본 발명의 실시예가 삼각 퍼지 수에 한정되는 것은 아니다. 삼각 퍼지 수는 도 5의 (a)와 같이 소속 함수에 대하여 하한 값(l), 중앙 값(m), 상한값(n)으로 구성될 수 있다.

 

사용자 정보 수집부는 일대일 평가를 진행한 후에 도 5의 (b)와 같은 쌍대비교 행렬을 작성할 수 있다. ( 사용자 정보 수집부는 구성된 쌍대비교 행렬로 퍼지 합성 확장 값(Value of Fuzzy Synthetic Extent, Si)을 계산한다. 사용자 정보 수집부(는 쌍대비교 행렬 A의 원소 aij의 속성 i번째의 퍼지 합성 확장 값을 도 5의 (c)와 같이 계산할 수 있다. 사용자 정보 수집부는 퍼지 합성 확장 값을 이용하여 삼각 퍼지수 S1=(l1,m1,u1)와 S2=(l2,m2,u2)의 S1 [0048] ≥S2일 가능성 정도(Degree of Possibility, d′)를 계산한다. 가능성 정도는 도 5의 (d)를 통하여 이루어질 수 있는데, 도 5의 (d)는 도 5의 (e)를 이용하여 계산될 수 있다. 사용자 정보 수집부는 가능성 정도를 이용하여 각 계층의 선호도의 합이 1이 되도록 정규화를 한다. 사용자 정보 수집부는 각 계층별로 구한 선호도를 상위 계층과 종속된 하위 계층끼리 서로 곱하여 종 합 선호도를 계산한다.  사용자 정보 수집부는 종합 선호도의 우선순위를 구하고, 우선순위가 높은 평가 기준이나 평가 요소를 선택한다. 이와 같은 과정을 통하여 사용자 정보 수집부는 도 3의 선호 기준 및 선호 요인에 대한 우선순위를 도출할 수 있다. 이에 따라 선호 기준 및 선호 요인가 우선순위에 따라 정렬될 수 있다.

 

한편, 영화 평가 학습부는 도 2의 네티즌들의 단말기들에 의하여 작성된 영화 평가 텍스트 데이터를 수집 한 뒤 영화 평가 텍스트 데이터를 LSTM(Long Short Term Memory) 언어 모델로 학습하여 영화 관련 항목에 해당 되는 학습 결과 시퀀스 데이터(sequence data)를 도출한다. 네티즌의 단말기는 PC, 랩탑 컴퓨터, 스마트폰, 태 블릿 PC 등일 수 있으나 이에 한정되는 것은 아니다.

 

영화 평가 학습부는 영화 평가 텍스트 데이터를 스크래핑(scraping)을 통하여 수집할 수 있다. 스크래핑은 웹 상의 데이터, 즉 HTML 형식의 공개된 데이터에서 필요한 정보를 추출하는 것을 말한다. 또는 영화 평가 학습 부는 크롤링(crawling)을 통하여 영화 평가 텍스트 데이터를 수집할 수 있다. 크롤링은 웹 사이트에서 하 이퍼링크를 돌며 웹 페이지를 다운로드하는 방법을 말한다.

 

영화 평가 텍스트 데이터는 도 2의 영화 평가 기록 서버에 저장된 것으로 영화 관련 댓글, 영화 리뷰에 대한 댓 글, SNS 리트윗 자료, 뉴스 기사 등을 포함하나 이에 한정되는 것은 아니다. 영화 평가 기록 서버는 네이버와 같은 포털 서비스 제공 회사, 트위터와 같은 SNS 회사, 신문과 같은 언론 회사의 서버일 수 있으나 이에 한정되 는 것은 아니다. 

 

영화 평가 학습부는 영화 평가 텍스트 데이터를 수집한 뒤 수집된 영화 평가 데이터에 대한 전처리를 수행 할 수 있다. 영화 평가 학습부는 수집된 영화 평가 텍스트 데이터를 하나의 파일로 병합하고, 병합된 파일 에 존재하는 특수 문자를 제거하는 전처리를 수행할 수 있다.

반응형