[KoCon] 밀키트 제품 리뷰 데이터를 이용한 텍스트 분석 사례 연구(2022)

밀키트 제품 리뷰 데이터를 이용한 텍스트 분석 사례 연구
A Case Study on Text Analysis Using Meal Kit Product Review Data
한국콘텐츠학회 논문지
약어 : Jour. of KoCon.a
2022, vol.22, no.5, pp. 1-14 (14 pages)
DOI : 10.5392/JKCA.2022.22.05.001
발행기관 : 한국콘텐츠학회
연구분야 : 복합학 > 학제간연구
최혜선 /Hyeseon Choi 1 , 연규필 /Kyupil Yeon 2
1호서대학교 빅데이터AI학과, 2호서대학교
초록
본 연구에서는 밀키트 제품 평가에 영향을 미치는 요인을 파악하기 위하여 밀키트 제품 리뷰 데이터에 대한 텍스트 분석을 수행하였다. 분석에 사용된 자료는 네이버 쇼핑 사이트에서 판매되고 있는 밀키트 제품에 대한 리뷰 334,498건을 스크래핑하여 수집하였다. 텍스트 자료에 대한 전처리 과정을 거쳐 제품 리뷰에 빈번히 등장하는 단어를 추출한 후 워드클라우드 및 감성분석을 수행하였다. 감성분석시 제품 리뷰에 대한 긍정 또는 부정의 레이블은 평점을 기준으로 설정하여 반응변수로 활용하였고, 입력변수로는 단어들의 정규화 단어빈도-역문서빈도 (TF-IDF) 값을 구하여 사용하였다. 리뷰의 극성을 판별하는 모형으로는 로지스틱 회귀모형, 서포트 벡터 머신, 랜덤 포레스트 알고리즘을 적용하였으며, 분류 정확도 및 해석가능성을 고려하여 로지스틱 회귀모형을 최종 모형으로 선택한 후 제품 범주별 감성분석 모형으로 사용하였다. 각 제품 범주별로 도출된 로지스틱 회귀모형으로부터 밀키트 제품 구매 후 긍·부정의 감성을 발생시킨 주요 요인들을 밝혀내었다. 결과적으로 텍스트 분석을 통해 밀키트 제품 개발 시 특정 카테고리, 메뉴, 재료에 대한 긍정 요소를 극대화하고 부정적 위험 요소를 제거할 수 있는 기반을 제공할 수 있음을 확인하였다.
In this study, text analysis was performed on the mealkit product review data to identify factors affecting the evaluation of the mealkit product. The data used for the analysis were collected by scraping 334,498 reviews of mealkit products in Naver shopping site. After preprocessing the text data, wordclouds and sentiment analyses based on word frequency and normalized TF-IDF were performed. Logistic regression model was applied to predict the polarity of reviews on mealkit products. From the logistic regression models derived for each product category, the main factors that caused positive and negative emotions were identified. As a result, it was verified that text analysis can be a useful tool that provides a basis for maximizing positive factors for a specific category, menu, and material and removing negative risk factors when developing a mealkit product.
키워드
감성분석, 단어빈도-역문서빈도, 로지스틱회귀모형, 밀키트, 워드클라우드
Sentiment Analysis, TF-IDF, Logistic Regression Model, Mealkit, Wordclouds
인용
최혜선 and 연규필. (2022). 밀키트 제품 리뷰 데이터를 이용한 텍스트 분석 사례 연구. 한국콘텐츠학회 논문지, 22(5), 1-14.
자료원: 한국학술지인용색인
밀키트 제품 리뷰 데이터를 이용한 텍스트 분석 사례 연구
본 연구에서는 밀키트 제품 평가에 영향을 미치는 요인을 파악하기 위하여 밀키트 제품 리뷰 데이터에 대한 텍스트 분석을 수행하였다. 분석에 사용된 자료는 네이버 쇼핑 사이트에서 판매되고
www.kci.go.kr