Current Issue

Journal of the East Asian Society of Dietary Life - Vol. 30 , No. 5

[ Original research ]
Journal of the East Asian Society of Dietary Life - Vol. 30, No. 5, pp.386-395
Abbreviation: J East Asian Soc Diet Life
ISSN: 1225-6781 (Print) 2288-8802 (Online)
Print publication date 31 Oct 2020
Received 16 Oct 2020 Revised 04 Nov 2020 Accepted 04 Nov 2020
DOI: https://doi.org/10.17495/easdl.2020.10.30.5.386

텍스트마이닝을 이용한 일본 음식의 유자 활용 동향 분석 : 온라인 레시피를 중심으로
김서영1, 2 ; 유라2 ; 김도희3 ; 양희4,
1차세대융합기술연구원 XO센터 책임연구원
2서울대학교 농업생명과학대학 농생명공학부 바이오모듈레이션 전공 박사과정
3차세대융합기술연구원 XO센터 인턴
4서울대학교 생명공학공동연구원 책임연구원

Analysis of Yuza (Citrus junos) Usage Trends in Japanese Food through Text Mining : Focus on Online Recipes
Seo-Young Kim1, 2 ; Ra Yoo2 ; Do-Hee Kim3 ; Hee Yang4,
1Senior Researcher, XO Center, Advanced Institute of Convergence Technology, Suwon 16229, Republic of Korea
2Ph. D. Student, Biomodulation Major, Department of Agricultural Biotechnology, College of Agriculture and Life Sciences, Seoul National University, Seoul 08826, Republic of Korea
3Intern, XO Center, Advanced Institute of Convergence Technology, Suwon 16229, Republic of Korea
4Senior Researcher, Bio-MAX Institute, Seoul National University, Seoul 08826, Republic of Korea
Correspondence to : Hee Yang, Tel: +82-2-880-4662, E-mail: yhee6106@snu.ac.kr


Abstract

Yuza (Citrus junos) is mainly produced in Korea and Japan with diverse uses in different dishes. The purpose of this study was to quantitatively analyze the trends of yuza usage as an ingredient in dishes and categorize them. We extracted and analyzed recipe data for twenty years (from January 1, 2000 to December 31, 2019) from Japan’s largest recipe sharing website using text mining. We collected 33,690 relevant food recipes, then classified their yuza usage into 11 categories. We found that 17,741 recipes (52.7%) used yuza as ‘seasoning’, and this accounted for more than half of the total collected recipes. Yuza kosho had the most data counts within the ‘seasoning’ category (47.1%), and yuza usage in the rest of the category (ponzu, miso, vinegar, chili powder, salt) accounted for 5.6%. The use of yuza as ‘fruit’ (raw, peel, juice) accounted for 42.7% of the total usage and its use in the ‘preserved in sugar’ category (tea, jam) were only 4.7%. The results indicated different usage patterns in Japan as compared to Korea. Also, the month-by-month analysis showed that the frequency rates of usage of yuza in the ‘fruit’ and the ‘preserved in sugar’ categories increased in winter and decreased in summer. In June, 73.7% of the yuza usage was as yuza kosho, which is a segment within the ‘seasoning’ category. In December, 71.1% of the yuza usage was categorized as ‘fruit’, while its use as ‘seasoning’, yuza kosho and yuza ponzu were season independent and consistent throughout the year. After analyzing the recipe data of 15 major dish categories using yuza, it was observed that the ratio of yuza use in confectionery was 21.5%, followed by salads (17.9%), pasta (11.3%), pickles (10.4%), and bread (7.7%). We believe that this study provides the opportunity to understand the differences between the food cultures of Korea and Japan by analyzine the usage trends of yuza.


Keywords: yuza, food recipe, ingredient, text mining, Japan

서 론

유자나무(Cistrus jonos)는 운향과에 속하는 상록활엽관목으로 한국과 일본에서 주로 재배되며, 내한성이 약하여 겨울철이 온난한 일부 해안지역에서만 재배된다(Encyclopedia of Korean Culture 2017). 과거에는 한국과 일본에서만 유자를 주로 섭취하였으나, Kati(2019)에 따르면, 최근 한국의 유자차가 중국, 미국 등으로 수출됨에 따라 전 세계적으로 유자에 관한 관심이 높아지고 있다.

유자는 풍부한 향기 성분을 가지고 있을 뿐 아니라(Hong YS 등 2017), 비타민이 풍부하며 특히 비타민 C는 레몬보다 2배 가까이 함유하였다(National Institute of Agricultural Sciences 2016). 이외에도 유자에는 플라보노이드가 풍부하게 함유되어 있다고 알려졌는데, 특히 과피에는 항산화, 항염증, 천연 항균제 효과 등 다양한 생리 기능성을 나타내는 나린진(naringin)과 항산화, 항염증, 혈압강하, 항알러지, 혈중 콜레스테롤 억제 등의 생리 기능성을 가지는 헤스페리딘(hesperidin) 성분이 풍부한 것으로 알려졌다(Moon SH 등 2015; Lee JE 등 2017). 이처럼 유자에 대한 다양한 생리활성 연구가 알려지고, 건강에 대한 소비자의 관심이 높아지면서 유자를 활용한 다양한 제품에 대한 요구가 더욱 높아지고 있다.

한국에서는 전통적으로 유자를 가늘게 채 썰어 화채를 만들거나, 꿀에 재어 유자청으로 만들어 차로 끓여 먹었다(Encyclopedia of Korean Culture 2017). 최근에는 유자즙과 분말을 활용한 다양한 가공품 개발이 연구되고 있으며, 유자즙과 분말을 활용한 쿠키(Kim HY & Kong HJ 2006), 초콜릿(Yoo KM & Lee H 2008) 등 디저트류에 적용하거나, 진양주(Jin TY 등 2008), 막걸리(Yang HS & Eun JB 2011) 등 주류에 접목한 바 있으며, 그 외 식초(Jeong EJ 등 2011), 요구르트(Yoon MR 등 2016) 등 발효제품에 적용한 바 있다. 그러나 이러한 다양한 가공품 개발 연구에도 불구하고, 한국의 유자 가공품은 당 절임 가공을 한 유자차가 주류를 이루고 있어, 유자를 다양한 형태로 개발하여 상용화하는 방안은 미진한 상태로 남아 있다(Fukutome N 2020).

한편, 같은 동아시아 국가인 일본의 경우, 유자 생산량은 2016년 2만 6천 톤으로(Ministry of Agriculture Forestry and Fisheries of Japan 2020), 같은 해 1만 1천 톤을 생산한 한국에 비해 두 배 이상 높으며(Kati 2019), 유자모찌, 과자 등 디저트에 활용할 뿐 아니라, 초밥을 만들 때 식초 대신 유자즙을 사용하거나, 혹은 찜 요리에 유자 과육과 과피를 활용하기도 하는 등, 한국과 비교해 디저트, 양념 및 일반 음식에 광범위하게 다양한 형태로 소비한다(Fukutome N 2020). 이처럼 일본에서는 유자를 음식에 활용하는 방식이 한국보다 훨씬 다양한 것으로 알려졌기에, 레시피 분석을 통해서 유자의 활용 방식을 정량적으로 분석하여 이를 레시피 확보 및 제품 개발에 응용할 필요가 있다고 생각된다.

최근 스마트 미디어의 발전에 따라 온라인상 공유되는 레시피 데이터양이 꾸준히 증가하고 있으며, 이에 따라 온라인 레시피 데이터를 활용한 연구도 활발해지고 있다(Choi JY & Han GS 2017). Kim KJ & Chung CH(2016)는 22개국 약 6천개의 온라인 레시피 데이터를 활용해 전 세계적으로 널리 쓰이는 식재료가 소금, 양파, 마늘, 후추, 설탕 순임을 분석한바 있다. 과거에는 생산량, 수입량, 판매량 등 거시적인 데이터로 식재료 활용 정도를 추정하였으나, 최근에는 많은 양의 텍스트를 정량적으로 분석하는 텍스트마이닝(text mining) 연구방법론을 적용하는 사례가 늘어나고 있으며(Sajadmanesh S 등 2017), 더욱 직관적인 방식으로 프로그래밍할 수 있는 프로그래밍 언어인 파이썬(python)의 등장과 머신러닝(machine learning), 자연어 처리(natural language processing) 등 텍스트 데이터를 체계적으로 수집, 분석할 수 있는 관련 기술의 발달로 인해(Kaushik A & Naithani S 2016), 온라인 레시피 데이터로부터 식재료 종류 등 세부적인 데이터를 추출하고, 이에 대한 정량분석이 더욱 빠르고 쉽게 되었다. Son NR 등(2018)은 중국과 일본에서 한국전통식품 레시피를 수집하여 사회관계망분석(social network analysis)을 통해 식재료를 분석한 바 있다. 이를 토대로 특정 식재료가 어떻게 음식에 활용되는지를 분석해 보면, 식재료 용도별 활용에 도움이 될 것으로 파악하였다.

본 연구에서는 일본의 최대 온라인 레시피 사이트에 등록된 레시피 데이터 내 식재료 목록을 추출하여, 일본에서 유자가 활용되는 식재료 형태, 계절에 따른 사용 추이 및 어떤 음식에 주로 유자가 활용되는지를 텍스트마이닝 연구방법론의 단어빈도분석을 통해 분석하였다. 인접한 동아시아 국가인 일본에서는 ‘유자’를 어떻게 일본의 식문화에 맞게 식재료로 활용하고 있는지를 살펴보고, 한국 식문화와의 차이점을 토대로 국산 유자만의 지속가능하고 다양한 활용 방안을 모색하고자 한다.


연구방법
1. 데이터 수집
1) ‘유자’ 검색어를 통한 전체 레시피 수집

데이터는 일본의 레시피 공유사이트인 쿡패드(Cookpad 2020)에서 수집하였다. 쿡패드는 일본의 최대 레시피 공유사이트로서(SimilarWeb 2020), 레시피 사진, 제목, 간략한 설명, 식재료의 목록, 조리 방법 등에 대한 정보를 제공한다(Nakano M 등 2018). 개별 레시피로부터 유자를 활용한 식재료 형태 및 형태별 빈도수를 파악하기 위하여 먼저, 유자의 일본어 한자표현 ‘柚子’를 검색어로 하여 검색된 모든 레시피를 수집하였으며, 히라가나 표현인 ‘ゆず’도 함께 수집하였다. 텍스트마이닝 연구방법론을 위해 사용한 프로그래밍 언어는 파이썬을 사용하였으며, 웹페이지에서 데이터를 추출하기 위하여 파이썬의 데이터추출 패키지 중 하나인 유틸스(utils)를 사용하였다(Ryan M 2018). 데이터 수집 기간은 2000년 1월 1일부터 2019년 12월 31일까지 총 20년이며, 수집 항목은 레시피 제목, 레시피 ID, 식재료 및 날짜이다(Fig. 1). 레시피 중 가장 오래된 레시피는 2000년 2월, 가장 최근 레시피는 2019년 6월로 총 37,417건을 수집하였다.


Fig. 1. 
Example of collected data from the online recipe website: title, ingredients, recipe ID, date.

2) 주요 음식 카테고리별 레시피 수집

쿡패드에서 유자를 전체 검색하여 수집할 경우 각 개별 레시피가 어떤 음식 카테고리의 레시피인지에 대한 정보는 제공되지 않기 때문에, 음식 카테고리별 유자 활용 정도를 분석하기 위해 별도로 쿡패드에서 제공하는 ‘레시피 카테고리(レシピカテゴリ)’ 항목에서 주요 음식 카테고리 15종에 대해 독립적으로 레시피 데이터를 수집한 후, 음식 카테고리별로 식재료에서 유자를 활용한 정도를 확인하였다. 이때 데이터 수집은 1-1과 동일한 방법과 기간을 적용하였다. 다만, 수집 항목은 레시피 제목, 레시피 ID, 식재료이며, 날짜는 제외하였다. 주요 음식 카테고리 15종으로는 국수류 4종(파스타, 우동, 라면, 볶음우동), 밥/국류 4종(도시락, 나베, 덮밥, 주먹밥), 반찬류 4종(샐러드, 절임, 달걀말이, 튀김), 제과제빵 2종(과자류, 빵류) 및 기타(다이어트 음식)이었다.

2. 데이터 분석
1) 유자 식재료 종류 및 월별 활용 현황 분석

유자를 활용한 ‘유자 식재료’를 종류별로 구분하기 위해, 1-1에서 유자(‘柚子’ 또는 ‘ゆず’)를 검색어로 하여 수집한 식재료 목록 중 유자즙, 유자폰즈 등 ‘유자’를 포함한 식재료 단어만을 추출하여 새로운 열에 추가하여 정리하였다. ‘식재료’ 목록에서 유자의 히라가나 표현 ‘ゆず’는 모두 한자표현 ‘柚子’로 변경하여 통일시킨 후, ‘柚子’가 포함된 모든 단어를 추출하는 방식을 사용하였다. 예를 들어 ‘柚子胡椒(유자코쇼)’와 같이 ‘柚子(유자)’라는 단어를 포함한 식재료의 종류를 ‘유자 식재료’로서 새로운 열에 정리되도록 하였다. 이때 문자를 제외한 특수문자, 숫자 등이 제거되도록 전처리하였다(Bird S 등 2009). 수집된 ‘유자 식재료’ 목록 중에서 식재료로서 유자가 가장 보편적으로 활용되는 형태를 파악하기 위해 유의미한 해석이 어려운 0.07% 미만 아주 낮은 빈도의 식재료를 제외하고, 특히 빈도수가 높은 식재료 목록 40개를 선별하였다. 이 과정에서 파이썬에 내장된 자료 분석 모듈 중 하나인 ‘collections’를 사용하였고(Bird S 등 2009), 텍스트마이닝의 보편적인 기법인 단어빈도분석(word counting) 기법을 활용하였다(Vidal L 등 2015). 상위 40개 ‘유자 식재료’를 포함하는 레시피는 총 33,690건이었고, 그중에서도 의미가 유사한 단어끼리 묶어 분류하였다. 먼저 柚子(=ゆず)(유자), 刻み柚子(잘게 썬 유자), 柚子など(유자 등), 乾燥柚子(건조 유자), 青柚子(청유자)는 모두 ‘유자’로 분류하였으며, 柚子の皮(유자의 껍질), 柚子皮(유자 껍질), 柚子ピール(유자 껍질), 柚子皮すりおろし(유자껍질 강판에 간 것), 柚子の皮の千切り(유자의 껍질 채썬 것), 柚子の皮すりおろし(유자껍질 간 것), あれば柚子の皮(유자껍질이 있다면), 柚子の皮千切り(유자의 껍질 채썬 것)은 ‘유자껍질’로, 柚子果汁(유자과즙), 柚子の絞り汁(유자의 짠즙), 柚子の果汁(유자의 과즙), 柚子絞り汁(유자짠즙), 柚子のしぼり汁(유자의 짠즙), 柚子汁(유자즙), 柚子の搾り汁(유자의 착즙), 柚子の汁(유자의 즙), 柚子れもん(유자레몬: 시판음료), 和果ごこち柚子れもん(유자레몬: 시판음료 브랜드명)는 ‘유자즙’으로, 柚子茶(유자차), 柚子はちみつ(유자꿀)은 ‘유자차’, 柚子ジャム(유자잼), 柚子マーマレード(유자마멀레이드)는 ‘유자잼’으로, 柚子胡椒(유자코쇼), 柚子コショウ(유자코쇼), 柚子こしょう(유자코쇼), ゆずごしょ(유자고쇼)는 ‘유자코쇼’로, 柚子ポン酢(유자폰즈), 柚子ぽん(유자폰즈), 柚子ポン(유자폰즈), 柚子ぽん酢(유자폰즈)는 ‘유자폰즈’, 柚子七味(유자시치미), 柚子入り七味唐辛子(유자가 들어간 시치미토라가시)는 ‘유자고춧가루’, 柚子塩(유자염)은 ‘유자 소금’으로 분류함으로써, 최종적으로 유자, 유자껍질, 유자즙, 유자차, 유자잼, 유자코쇼, 유자폰즈, 유자된장, 유자식초, 유자고춧가루, 그리고 유자소금으로 총 11개로 분류하였다. 이는 다시 유자, 유자껍질, 유자즙과 같이 ‘과일류(Fruit)’ 형태로 레시피에 활용한 경우와, 유자차와 유자잼과 같이 유자를 ‘당절임류(Preserved in sugar)’하여 활용한 경우, 유자코쇼, 유자폰즈, 유자된장, 유자식초, 유자고춧가루, 유자소금과 같이 유자를 ‘양념류(Seasoning)’로 활용한 경우로 크게 3가지로 재분류하였다.

또한, 계절에 따른 유자의 활용 추이를 파악하기 위해 유자(‘柚子’ 또는 ‘ゆず’)를 검색어로 하여 수집된 전체 개별 레시피들이 공개된 날짜 정보로부터 ‘월’ 정보만을 추출하여 새로운 열에 추가하여 정리하였다. 예를 들어, “2019/12/31”을 ‘12’로 분리하여 월에 대한 정보가 표시되도록 하였다. 이후 단어빈도분석 기법을 활용하여 월별 활용 추이를 분석하였다. 파이썬의 패키지 중 하나인 ‘matplotlib’를 사용하여 분석한 후(Bird S 등 2009), 시그마플롯(sigmaplot v.10.0)을 사용하여 그래프를 작성하였다.

2) 음식 카테고리별 식재료의 유자 활용 분석

음식 카테고리별 유자의 활용 정도를 살펴보기 위해서, ‘레시피 카테고리(レシピカテゴリ)’ 항목에서 주요 음식 카테고리 15종에 대해 독립적으로 수집한 레시피 데이터로부터 음식 카테고리별 레시피의 식재료 목록 중 유자의 히라가나 표현 ‘ゆず’을 모두 한자표현 ‘柚子’로 변경하여 통일시킨 후, ‘柚子’가 포함된 모든 단어를 검색하는 방법으로, 음식 종류별 단어빈도분석을 시행하였다(Vidal L 등 2015). 파이썬 패키지는 2-1)과 동일하게 사용하여 분석하였다.


결과 및 고찰
1. 유자 식재료 종류 분석

유자 레시피를 수집 정리한 예시를 Table 1과 같이 나타내었다. 가장 오래된 레시피는 2000년 2월에 공개된 레시피로 레시피 ID 1851의 레시피명은 ‘和風カルパッチョ(일본풍 카르파초: 이탈리아 요리)’, 식재료 목록은 ‘白身魚のお刺身(または生たこ)(흰살 생선회 (혹은 산낙지))’, ‘オクラ(오크라 : 아욱과 식물)’, ‘柚子ぽん(유자폰즈)’였으며, 가장 최근 레시피는 2019년 6월에 공개된 레시피로 레시피 ID 5687558의 레시피명은 ‘豆腐と柚子のスープ♪(두부와 유자스프♪)’, 식재료 목록은 豆腐(두부), 柚子(유자), 小ねぎ(쪽파), 水(물), 醤油(간장), 水溶き片栗粉(片栗粉:水)(수용녹말 (녹말가루:물))이었다.

Table 1. 
The first and the most recent recipe data using yuza ingredients collected from the online recipe website in original Japanese texts and translated into English
Recipe ID Title Ingredients Yuza ingredients Year Month
1851 和風カルパッチョ
(Japanese-style carpaccio)
大根(radish), ブリ(yellowtail), 昆布(kelp), 砂糖(sugar), 醤油(soy sauce), 酒(liquor), 塩(salt), 柚子(yuza) 柚子(yuza) 2000 02
5687558 豆腐と柚子のスープ♪
(Tofu and yuza soup♪)
豆腐(tofu), 柚子(yuza), 小ねぎ(green onion), 水(water), 醤油(soy sauce), 水溶き片栗粉(片栗粉:水)
(water-soluble potato starch (potato starch : water))
柚子胡椒(yuza kosho) 2019 06

Table 2는 유자 식재료의 사용빈도를 카테고리별로 분류한 표이다. 먼저 유자를 유자, 유자껍질, 유자즙과 같이 ‘과일류’ 형태로 레시피에 활용한 경우는 전체 33,690건 중 42.7%(14,380건)에 달했으며, 세부적으로는 유자가 19.1%(6,436건)로 가장 많았고, 유자껍질 15.9%(5,360건)와 유자즙 7.7%(2,584건) 순이었다. 한국의 경우, 유자 자체를 음식에 활용하는 경우는 거의 없는 반면, 일본은 유자를 자체를 잘라서 혹은 즙 형태로도 음식에 많이 활용하고 있음을 확인하였다. 유자 껍질의 경우, 대부분 잘게 자른 형태인데, 이는 샐러드 등 음식에 활용하기도 하지만 풍미와 미각적인 효과를 더하는 장식(garnish)으로서 활용하는 것으로 보인다(Miyazawa N 등 2009). 또한, 일본에서는 한국과 달리 여름에 일찍 수확한 ‘청유자’도 사용한다고 알려졌으나(Tajima K 등 1990), 본 분석에서는 총 117건으로 청유자 자체를 음식에 활용하는 빈도수는 높지 않았다.

Table 2. 
Frequency of recipes with yuza ingredients in different expressions such as Chinese characters, Hiragana or Katakana by categories and sub-categories
Category Sub-category Yuza ingredients Word counts %
Fruit Yuza 柚子(yuza), 刻み柚子(chopped yuza), 柚子など(yuza etc.), 乾燥柚子(dried yuza), 青柚子(green yuza) 6,436 19.1
Yuza peel 柚子の皮(yuza peel), 柚子皮(yuza peel), 柚子ピール(yuza peel), 柚子皮すりおろし(grated yuza peel), 柚子の皮の千切り(shredded yuza peel), 柚子の皮すりおろし(grated yuza peel), あれば柚子の皮(if there is yuza peel), 柚子の皮千切り(shredded yuza peel) 5,360 15.9
Yuza juice 柚子果汁(yuza juice), 柚子の絞り汁(yuza juice), 柚子の果汁(yuza juice), 柚子絞り汁(yuza juice), 柚子のしぼり汁(yuza squeezed juice), 柚子汁(yuza juice), 柚子の搾り汁(yuza juice), 柚子の汁(yuza juice), 柚子れもん(yuza lemon), 和果ごこち柚子れもん(yuza lemon juice : the brand name) 2,584 7.7
Sub total 14,380 42.7
Preserved in sugar Yuza tea 柚子茶(yuza tea), 柚子はちみつ(yuza honey) 853 2.5
Yuza jam 柚子ジャム(yuza jam), 柚子マーマレード(yuza marmalade) 715 2.1
Sub total 1,568 4.6
Seasoning Yuza kosho 柚子胡椒(yuza kosho), 柚子コショウ(yuza kosho), 柚子こしょう(yuza kosho), ゆずごしょ(yuza gosho) 15,880 47.1
Yuza ponzu 柚子ポン酢(yuza ponzu), 柚子ぽん(yuza ponzu), 柚子ポン(yuza ponzu), 柚子ぽん酢(yuza ponzu) 1,060 3.1
Yuza miso 柚子味噌(yuza miso) 311 0.9
Yuza vinegar 柚子酢(yuza vinegar) 187 0.6
Yuza chili powder 柚子七味(yuza chilipowder), 柚子入り七味唐辛子(yuza chilipowder) 162 0.5
Yuza salt 柚子塩(yuza salt) 142 0.4
Sub total 17,742 52.7
Total 33,690 100.0

유자를 ‘당절임류’ 유자차와 유자잼과 같은 형태로 활용한 경우는 각각 2.5%(853건), 2.1%(715건)로 전체 4.6%(1,568건)에 그쳤다. 일본에서는 전통적으로 당절임한 유자청 형태의 유자차는 없었으나, 최근 한국의 유자차가 수입되면서 알려진 것으로, 유자차가 한국만큼 보편적인 유자 식재료 형태는 아닌 것으로 보인다(Fukutome N 2020). 또한, 이렇게 빈도가 낮게 나타난 것은 유자차와 유자잼의 경우 뜨거운 물에 타거나, 빵에 바르는 등 매우 간단한 요리과정을 거치기 때문에 별도의 레시피로 기록하는 경우가 낮은 것도 이유가 될 수 있다고 추정한다. 즉, 레시피 식재료 빈도분석 연구를 통해 활용 형태별 정량적인 연구가 가능했지만, 요리 레시피를 남기지 않는 형태에 대해서는 빈도가 낮을 수 있는 한계점이 있다.

마지막으로 유자를 양념 형태로 활용한 경우가 전체 33,690건 중 52.7%(17,742건)로 절반이 넘게 차지하였다. 세부적으로는 유자코쇼가 전체의 47.1%(15,880건)로 거의 절반을 차지하였고, 그 외 유자폰즈, 유자된장, 유자식초, 유자고춧가루, 그리고 유자소금은 전체의 6% 이하였다. 일본의 유자 양념의 경우, 단순히 기존의 양념에 유자향을 더한 것이 아니라, 새로운 형태의 양념이 많았다. 가장 사용 빈도가 높은 유자코쇼의 경우, 원래 청유자 껍질을 소금과 고춧가루와 함께 발효한 것으로 일본 오이타현에서 주로 사용하던 양념이었으나, 최근 일본 전국적으로 퍼지면서 청유자 대신 일반 유자도 사용하게 되었으며, 최근에는 일본의 독특한 양념으로 미국 등에 수출하고 있다(Fukutome N 2020). 폰즈는 감귤류 즙이 가미된 초간장 조미액으로, 유자즙을 활용한 경우가 일반적이다(Jeong EJ 등 2011). 유자고춧가루로 해석한 것은 시치미토라가시(七味唐辛子)로, 고춧가루 등 7가지 향신료를 섞어 만든 일본의 독특한 양념이다(Hosking R 1995).이처럼 일본에서는 요리에 맞는 다양한 유자 양념을 개발하여 음식에 활용하는 것으로 보인다. Sherman PW & Billing J(1999)가 36개국에서 93권의 전통요리책을 분석한 결과에 따르면, 한국에서 사용빈도가 높은 향신료는 ‘마늘, 양파, 후추, 깨’인 반면, 일본의 경우 ‘양파, 레몬/라임, 생강, 고춧가루’로 나타났다. 일본에서는 유자와 유사한 레몬이나 라임을 이미 음식에 사용하는 식문화이기 때문에, 이처럼 유자의 활용에서 차이를 나타낸 것으로 보인다. 한국에서는 상대적으로 요리 시에 유자, 레몬/라임과 같은 시트러스 계열을 활용하는 것이 일반적이지 않으나, 조미료 대신 과일을 사용하는 것에 대한 선호도는 높은 편이므로(Lee KH 등 2015), 한국 고유의 전통 발효 기술 등을 접목한 다양한 형태의 유자 양념을 개발한다면, 기존 유자청 등의 활용에 그쳤던 국내 유자의 활용도를 보다 높일 수 있을 것이다.

본 연구에서는 텍스트마이닝 연구방법론을 통해 아주 많은 양의 레시피로부터 보편적으로 활용도가 있는 유자 식재료 종류를 빠르고 쉽게 분석하였다. 텍스트마이닝은 저렴한 비용으로 대량의 데이터를 빠르게 분석할 수 있다는 장점이 있다. 프로그래밍 언어를 활용한 텍스트마이닝과 전통적인 방식의 내용분석(contents analysis)을 비교한 Vidal L 등(2015)의 연구에 따르면, 4만 8천 개의 아침, 점심 및 저녁 시간대의 트위터 대화를 비교한 결과, 전통적인 방식에 따라 직접 사람이 수행한다면 두 사람이 각각 860시간이 소요되었으나, 프로그래밍 언어를 사용한 단어빈도분석의 경우, 한 사람이 두 시간 만에 처리 가능하여, 텍스트마이닝은 많은 양의 데 이터를 적은 비용으로 매우 짧은 시간에 처리할 수 있음을 밝혔다.

그러나 텍스트마이닝은 분석과 해석의 단계에서 언어에 대한 기본적인 이해가 있어야 하는 방법이다. 일본어는 특성상 같은 의미임에도 불구하고 한자, 가타카나 및 히라가나 표현이 각각 존재하며, 예를 들어 ‘유자코쇼’의 경우 한자표현 ‘柚子胡椒’ 12,353건, 가타카나 표현 ‘柚子コショウ’ 2,815건, 히라가나 표현 ‘柚子こしょう’ 644건이 확인되었다. 또한 ‘~의’를 뜻하거나 띄어쓰기 기능을 하는 ‘の’의 유무에 따라 같은 ‘유자껍질’을 의미함에도 ‘柚子の皮’과 ‘柚子皮’ 등 여러개의 표현으로 확인되었으며, 그 외 ‘채썰다’ ‘갈다’ 등 동사적 표현의 다양성도 존재하였다. 또한, 텍스트 데이터는 비정형 데이터로서 수치 데이터와 비교하면 누락 비율이 다소 높은 한계점이 있다. 본 연구에서도 ‘柚子’로 검색한 전체 개별 레시피 수는 총 37,417건이었으나, 유의미한 해석이 어려운 아주 낮은 빈도의 식재료를 제외하고, 상위 40개의 식재료 목록만 포함하는 레시피 데이터를 분석하였기 때문에 실제로는 33,690건으로 90.0%의 레시피만을 분석에 활용하였다. 통계 언어학에 대한 Piantadosi S(2014)에 따르면, 이러한 현상은 텍스트마이닝에서 보편적으로 나타나는 현상으로, 이처럼 텍스트마이닝 연구방법론은 빠르고 쉽게 많은 양을 분석해낼 수 있다는 장점이 있으나, 언어적인 차이와 누락 비율에 대한 부분을 유의하여 적용해야 함을 알 수 있다.

2. 유자 식재료별 활용 추이 시계열 분석

Fig. 2는 유자를 활용한 ‘유자 식재료’의 활용빈도를 월별로 나타낸 그래프이다. 유자를 과일 형태 식재료로 사용한 ‘과일류’(Fig. 2A)와 ‘양념류’ 중 유자코쇼(Fig. 2B) 형태 식재료로 활용된 경우는 모두 가장 많이 활용 시 1천 건 이상 빈도수를 보여, 가장 높은 빈도수가 150건 이하를 밑도는 ‘당절임류’(Fig. 2C) 또는 ‘양념류’ 내 다른 형태의 식재료(Fig. 2D)들에 비해 상대적으로 많이 활용되는 형태임을 알 수 있었다.


Fig. 2. 
Monthly frequencies of recipes using yuza ingredients over 20 years (from January 1, 2000 to December 31, 2019). (A: raw yuza, yuza peel, yuza juice, B: yuza tea, yuza jam, C: yuza kosho, D: yuza ponzu, yuza miso, yuza vinegar, yuza chilipowder, yuza salt, E: frequency of yuza ingredients in June and in December.

월별 사용 경향을 살펴보면 ‘과일류’의 경우 모두 12월에 최대 빈도수를 보였으며, 유자(1,857건), 유자껍질(1,325건) 및 유자즙(627건) 모두 같은 시기 다른 식재료들에 비해 높은 빈도를 나타냈다(Fig. 2A). 이러한 빈도는 1월과 2월을 지나며 감소 추세를 따르다 6월과 7월에 각각 유자(7월 90건), 유자껍질(6월 100건), 유자즙(7월 54건)으로 최소 빈도를 나타내었으며, 다시 11월부터 증가하는 U자 형태를 보였다. Fig. 2C에 나타낸 ‘당절임류’의 경우 ‘과일류’보다 전체적인 빈도수는 낮았으나, ‘과일류’와 마찬가지로 활용 추이가 겨울에는 증가하고 여름에는 다시 증가하는 확연한 U자 형태를 나타내며, 비교적 뚜렷하게 계절별 활용빈도가 다른 양상을 보였다. 이처럼 ‘과일류’와 ‘당절임류’ 모두 여름보다 겨울에 사용빈도가 증가하는 것은 유자의 수확 시기와 관련이 높은 것으로 보인다. 유자는 일본과 한국에서 11월에 수확을 시작하며(Song HS 등 1999), 유자는 그 특성상 수확 후 저장성이 짧은 특성이 있어, 우리나라에서도 11월 수확 직후 비교적 가공이 쉬운 당절임 유자차로 사용된다(Yoo KM 등 2004). 이에 따라 ‘당절임류’도 유자 수확 시기에 출시됨에 따라 겨울에 높은 사용 빈도를 보이는 것으로 추정된다.

한편, ‘양념류’로 활용한 경우는 다소 다른 양상을 보였다. 먼저 Fig. 2B를 살펴보면, 사용 빈도가 가장 높았던 유자코쇼의 경우 11월 최대 1,432건으로, 가장 빈도가 낮았던 8월 1,160건과 비교 시 크게 변화하지 않았다. 사용 빈도가 낮은 나머지 유자 양념류(Fig. 2D)도 살펴보면, 유자폰즈의 경우 최대 및 최소 빈도수가 각각 111건(7월), 55건(10월)로 ‘과일류’와 ‘당절임류’ 활용 추이에서 보인 양상과 반대로 여름에 약간 높고 겨울에 더 낮았지만, 전체적으로 빈도수가 낮아 뚜렷한 양상으로 해석하기는 어렵다. 그 외에도 유자된장, 유자식초, 유자고춧가루 및 유자식초의 경우는 모두 여름보다는 겨울에 높은 양상이 나타나기는 하나, 전체적으로 빈도수가 낮아 역시 계절별 다른 양상을 나타낸다고 해석하기는 어렵다.

계절별 식재료들의 상대적인 활용을 비교하기 위해 6월과 12월에 각 사용된 총 식재료 빈도의 비중을 나타내었다(Fig. 2E). 가장 빈도가 높았지만 연 사용량이 계절에 따라 크게 다르지 않았던 유자코쇼의 경우 6월에 사용된 전체 유자 식재료 중 73.7% 비중을 차지하였고, 12월에는 20.9% 비중을 차지하여, 여름인 6월에 유자코쇼의 상대적인 활용 비중이 월등히 높은 것으로 나타났다. 그 다음으로 전체 빈도가 높은 편이면서 U자 형태의 연 활용 추이를 보였던 과일류의 유자, 유자껍질, 유자즙의 경우, 6월에는 각각 전체의 5.0%, 5.4%, 3.5%의 비중을 차지할 뿐이지만, 12월에는 34.7%, 24.7%, 11.7%로 크게 올랐다. 즉, 6월에는 전체 유자 식재료의 73.7%가 유자코쇼로 많이 활용되는 반면, 12월에는 유자를 과일류 형태로 활용하는 경우가 71.1%로 그 양상이 다르게 나타났다. 유자는 저장성이 낮아 계절에 따라 활용도가 크게 차이 나는 식재료로 알려져 있는데, 유자코쇼 등 일부 양념류의 경우 이러한 계절성 없이 일상적으로 활용되는 것으로 나타났다. 일본의 경우 과일류 형태는 주 수확 시기인 겨울에 활용하되, 유자코쇼나 유자폰즈와 같이 일본의 독창적인 유자 양념 형태로서 유자의 낮은 저장성을 보완하여 활용하고 있는 것으로 보인다. 한국의 경우, 역시 낮은 유자 저장성으로 인해 주 수확 시기인 겨울에 과일류 또는 당절임 형태로 빠르게 소비하는 편이지만, 한국에서는 일본과 같은 유자를 활용한 식재료 종류가 다양하지 않은 데에는 귤, 한라봉, 천혜향 등 하우스 재배가 가능한 비슷한 시트러스 계열의 식재료가 많이 생산되고 있으며, 오히려 기후가 더운 나라에서 사용빈도가 높게 나타나는 레몬/라임 등(Sherman PW & Billing J 1999) 대체할 수 있는 다른 수입 시트러스 계열 과일류 활용 수요도 많아(USDA Foreign Agricultural Service 2019), 상대적으로 가격이 비싼 유자의 활용 자체에 대한 연중 수요가 높지 않은 것으로 추정된다.

3. 음식 카테고리별 유자 활용 현황 분석

Fig. 3은 쿡패드에서 주요 음식 종류 15종에서 유자의 활용 정도를 나타낸 것이다. 유자를 활용한 레시피의 음식 카테고리의 비중은 ‘과자류’ 21.5%(1,081건), ‘샐러드’ 17.9%(900건), ‘파스타’ 11.3%(569건), ‘절임’ 10.4%(525건), ‘빵류’ 7.7%(386건), ‘도시락’ 6.5%(325건), ‘나베’ 5.4%(274건), ‘우동’ 5.1%(255건), ‘덮밥’ 3.8%(189건), ‘다이어트’ 3.6%(182건), ‘주먹밥’ 1.7%(85건), ‘라면’ 1.6%(80건), ‘계란말이’ 1.6%(80건), ‘튀김’ 1.2%(60건), ‘볶음우동’ 0.8%(40건) 순으로 많았다.


Fig. 3. 
Frequency of recipes using Yuza as an ingredient for 15 major dish categories.

단일 종류로는 ‘과자류’가 21.5%로 가장 빈도가 높았고, ‘빵류’도 5순위를 차지했다. 이는 디저트에 유자의 독특한 향을 활용하는 것으로, 한국에서도 쿠키 등에 유자를 적용한 연구가 있어(Kim HY & Kong HJ 2006), 디저트는 유자를 적용하기 좋은 음식 종류로 보인다. 또한, 반찬류에서는 ‘샐러드’, ‘절임’ 등에 사용하는 경향을 보였는데, 이는 채소를 활용한 반찬류로서 ‘다이어트’에서 유자 활용이 나타나는 것과 같은 맥락으로 이해된다.

한편, 면류에서는 ‘볶음우동’보다는 ‘파스타’와 ‘우동’에서 유자사용이 더 높은 경향을 보였으며, 밥류에서는 여러 가지 반찬류를 포함하는 ‘도시락’이나 소스류를 함께 곁들이는 ‘덮밥’, ‘나베’에서 높은 편이었다. 한국의 경우 면류와 밥류에 유자를 활용하는 경우가 없으나, 일본에서는 면류와 밥류에서 유자 활용이 나타나는 것은 유자코쇼, 유자폰즈 등 양념류의 영향으로 보이며, 이는 앞선 연구인 식재료 빈도수에서 유자코쇼, 유자폰즈 등의 사용 빈도가 꾸준히 높았던 것과 일치한다고 볼 수 있다. 이처럼 레시피 분석을 통해 일본에서는 유자를 다양한 음식 카테고리에 활용하고 있으며, 이는 인접한 동아시아 국가인 한국과는 다름을 확인하였다. Min W 등(2018)에 따르면 레시피는 개개인의 요리 방식을 보여줄 뿐만 아니라, 지역별, 국가별 식문화 특성을 반영하고 있어 국가별 식문화를 이해하는 매개체로도 활용될 수 있다고 하였다. 특히 온라인 레시피 데이터의 경우 식재료뿐 아니라, 제목, 설명문, 요리 방법 등 다양한 정보를 풍부하게 제공하고 있어 추후 식문화 관점에서 다양한 연구 자료로 활용할 수 있다. 이 때, 레시피 데이터를 활용하여 식재료 활용 현황을 분석할 경우, 그 나라 고유의 문화에 대한 이해를 바탕으로 국가별 식문화의 차이를 충분히 고려하여 해당 식재료의 활용 현황을 해석, 고찰해야 함을 의미하기도 한다.

음식 종류별로 유자를 식재료로 활용한 레시피 빈도를 확인하는 것은, 유자를 식재료로서 활용하고 있는 음식 종류들을 상대적으로 살펴볼 수 있는 좋은 기준이 될 수 있지만, 각 음식 종류별 수집된 데이터양의 차이가 존재하여, 식재료 간 절대적인 경향을 비교하기에는 한계점은 있을 것으로 보인다. 실제로 등록된 레시피 대비 유자를 사용한 레시피 비율로 보았을 때는 ‘절임’, ‘나베’, ‘샐러드’ 등이 높았으며, ‘과자류’, ‘빵’ 등은 하위를 차지하며 순서가 다소 달라졌다. 그러나 유자 ‘양념류’를 주로 사용하는 ‘절임’, ‘나베’, ‘샐러드’가 상위를 차지하여 유자의 활용이 ‘양념류’로 개발되었을 때 활용도가 높다는 점에서는 같은 맥락을 가진다는 것을 알 수 있었다.


결 론

본 연구에서는 텍스트마이닝 기법을 활용하여 일본 최대 레시피 공유 사이트의 레시피 데이터를 추출하여, 텍스트마이닝 기법을 이용하여 유자를 활용한 식재료 종류와 계절별 추이, 음식 종류별 유자의 활용 빈도분석을 통해 일본 내 유자의 활용 정도를 정량적으로 분석하였다. 그 결과, 일본에서는 유자를 과일 형태의 식재료로 음식에 활용하는 빈도가 높고, 유자차와 같은 당절임 형태로는 활용 빈도가 상대적으로 낮은 것으로 나타났다. 과일과 당절임 형태 모두 유자 수확 시기인 겨울에 활용이 뚜렷하게 증가하는 경향으로 나타났다. 한편, 일본에서는 유자코쇼, 유자폰즈와 같이 유자를 독특한 양념 형태로 활용하는 것이 보편화 되었으며, 이는 계절적 영향도 크게 받지 않는 것으로 나타났다. 유자를 주로 활용하는 음식의 종류는 과자류, 빵류 등 디저트류가 상대적으로 높았고, 반찬류에서는 샐러드, 무침과 같은 채소 반찬이었으며, 밥/국류, 면류에서의 유자 활용 형태는 주로 ‘양념류’인 것으로 보인다. 유자는 한국과 일본 등 동아시아 일부 국가에서만 생산되는 식재료이나, 일본의 경우 일본 고유의 식문화에 맞춰 유자를 다양한 식재료 형태로 활용하고 있음을 확인하였다. 한국에서는 주로 유자를 당절임 형태의 차류로 활용하고 있으나, 이러한 연구를 통해 계절의 영향을 크게 받지 않는 유자를 활용한 한국만의 독특한 식재료 형태 활용 방안을 모색한다면 기존 유자의 짧은 유통기한으로 인한 한계점을 극복하면서도 국산 유자만의 장점을 적극 활용하여 적용할 수 있는 음식 종류를 보다 확장시킴으로써 국산 유자의 고부가가치화를 꾀하고, 유자차 이외 수출 확대를 위한 다양한 제품 개발 전략에도 기여할 수 있을 것이라 사료된다.


References
1. Bird S (2009) Natural Language Processing with Python: Analyzing Text with the Natural Language Toolkit. 1st Edition, O‘Reilly Media, Inc. United States of America. pp 52-55.
2. Choi JY, Han GS (2017) Structural analysis of cooking recipe texts - based on Kimchi Jjigae recipe. Korean J Community Living Sci 28(2): 191-201.
3. Cookpad (2020) Coopad. https://cookpad.com (accessed on 1. 10. 2020)
4. Encyclopedia of Korean Culture (2017) Yuzu. https://encykorea.aks.ac.kr (accessed on 1. 10. 2020)
5. Fukutome N (2020) Yuzu in Japan and South Korea: A comparative study of usage. Memoirs of Tokyo Seiei College 12: 1-17.
6. Hong YS, Lee YS, Kim KS (2017) Comparison of volatile flavor compounds of yuzu, kumquat, lemon and lime. Korean J Food Preserv 24(3): 394-405.
7. Hosking R (1995) A Dictionary of Japanese Food: Ingredients & Culture. Tuttle Publishing, Japan. p 159.
8. Jeong EJ, Jeon SY, Baek JH, Cha YJ (2011) Volatile flavor compounds in commercial vinegar beverages derived from fruits. J Life Sci 21(2): 292-299.
9. Jin TY, Wang MH, Yin Y, Eun JB (2008) Effect of Citrus junos peel on the quality and antioxidant activity of traditional rice wine, Jinyangju. J Korean Soc Food Sci Nutr 37(1): 76-82.
10. Kati (2019) Export Trends & Production Trends. https://www.kati.net (accessed on 1. 10. 2020)
11. Kaushik A, Naithani S (2016) A comprehensive study of text mining approach. Int J Commun Netw Inf Secur 16(2): 69-76.
12. Kim HY, Kong HJ (2006) Preparation and quality characteristics of sugar cookies using citron powder. Korean J Food Cook Sci 22(5): 712-719.
13. Kim KJ, Chung CH (2016) Tell me what you eat, and I will tell you where you come from: A data science approach for global recipe data on the web. IEEE Access 4: 8199-8211.
14. Lee JE, Kim KM, Kim JS, Kim GC, Choi SY, Kim SB (2017) Chemical compositions and antioxidant activities depending on cultivation methods and various parts of yuza. Korean J Food Preserv 24(6): 802-812.
15. Lee KH, Kim HY, Jang SJ (2015) Quality characteristics of sugar free fruit-vegetable jam containing calcium. J Korean Soc Food Sci Nutr 8(5): 829-834.
16. Min W, Bao BK, Mei S, Zhu Y, Rui Y, Jiang S (2018) You are what you eat: Exploring rich recipe information for cross-region food analysis. IEEE Trans Multimedia 20(4): 950-964.
17. Ministry of Agriculture Forestry and Fisheries of Japan (2020) Domestic Production and Production Area of Yuzu. https://www.maff.go.jp (accessed on 1. 10. 2020)
18. Miyazawa N, Tomita N, Kurobayashi Y, Nakanishi A, Ohkubo Y, Maeda T, Fujita A (2009) Novel character impact compounds in yuzu (Citrus junos Sieb. ex Tanaka) peel oil. J Agric Food Chem 57(5): 1990-1996.
19. Moon SH, Assefa A, Ko ES, Park SW (2015) Comparison of flavonoid contents and antioxidant activity of yuzu (Citrus junos Sieb. ex Tanaka) based on harvest time. Kor J Hort Sci Technol 33(2): 283-291.
20. Nakano M, Sato H, Watanabe T, Takano K, Sagane Y (2018) Mining online activity data to understand food consumption behavior: A case of Asian fish sauce among Japanese consumers. Food Sci Nutr 6(4): 791-799.
21. National Institute of Agricultural Sciences (2016) Korean Food Composition Table II. 9th Revision. National Institute of Agricultural Science, Korea. p 199, 215.
22. Piantadosi S (2014) Zipf’s word frequency law in natural language: A critical review and future directions. Psychon Bull Rev 21(5): 1112-1130.
23. Ryan M (2018) Web Scraping with Python: Collecting More Data from the Modern Web. O‘Reilly Media, Inc., United States of America. pp 53-68.
24. Sajadmanesh S, Jafarzadeh S, Ossia S, Rabiee H, Haddadi H, Mejova Y, Musolesi M, De Cristofaro E, Stringhini G (2017) Kissing cuisines: Exploring worldwide culinary habits on the web. Proc Int Conf World Wide Web, pp. 1013-1021.
25. Sherman PW, Billing J (1999) Darwinian gastronomy: Why we use spices. BioScience 49(6): 453-463.
26. SimilarWeb (2020) Top Sites Ranking for Food And Drink > Cooking And Recipes in the world. https://www.similarweb.com (accessed on 27. 10. 2020).
27. Son NR, Jeong S, Han GS (2018) Recipe analysis of Korean traditional representative food for export to China and Japan. Kor Next Generation Computing 14(5): 71-79.
28. Song HS, Sawamura M, Ito T, Ukeda H (1999) Chemical compositions of the volatile part of yuzu (Citrus junos Tanaka) peel cold-pressed oils from Japan and Korea. Flavour Fragr J 14(6): 383-389.
29. Tajima K, Tanaka S, Yamaguchi T, Fujita M (1990) Analysis of green and yellow yuzu peel oils (Citrus junos Tanaka). Novel aldehyde components with remarkably low odor thresholds. J Agric Food Chem 38: 1544-1548.
30. USDA Foreign Agricultural Service (2019) Citrus Annual of Korea. https://apps.fas.usda.gov (accessed on 27. 10. 2020)
31. Yang HS, Eun JB (2011) Fermentation and sensory characteristics of Korean traditional Fermented liquor (Makgeolli) added with citron (Citrus junos Sieb ex Tanaka) juice. Korean J Food Cook Sci 43(4): 438-445.
32. Yoo KM, Lee H (2008) Preparation of chocolate added with yuza (Citrus junos Seib ex Tanaka) and its antioxidant characteristics. Korean J Food Cook Sci 24(2): 222-227.
33. Yoo KM, Seo WY, Seo HS, Kim WS, Park JB, Hwang IK (2004) Physicochemical characteristics and storage stabilities of sauces with added yuza (Citrus junos) juice. Korean J Food Cookery Sci 20(4): 403-408.
34. Yoon MR, Seo JY, Ryu GE, Kim YH, Seo MC, Chang YK (2016) Physicochemical, microbial, rheological, and sensory properties of yogurt added with yuza pectin extract. J Korean Soc Food Sci Nutr 45(4): 562-568.
35. Vidal L, Ares G, Machín L, Jaeger SR (2015) Using twitter data for food-related consumer research: A case study on “what people say when tweeting about different eating situations”. Food Qual Prefer 45: 58-69.