Skip to content

This project was used for my undergraduate thesis in Education of System and Information Technology, Indonesia University of Education (Purwakarta branch)

Notifications You must be signed in to change notification settings

NAiTO2911/SentimentAnalystVTUBERIndonesia

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

image src. pixiv.net/en/users/3344291

Sentiment Analyst Virtual Youtuber in Indonesia

EN : This project was used for my undergraduate thesis in Education of System and Information Technology, Indonesia University of Education (Purwakarta branch)
ID : Projek ini digunakan untuk penelitian skripsi di Pendidikan Sistem dan Teknologi Informasi, Universitas Pendidikan Indonesia (Kampus Purwakarta)

What is Sentiment Analyst? / Apa itu Analisa Sentimen?

EN : Sentiment Analyst is one part of Nature Language Processing and information extraction which provided to get what writter can feel in positive or negative comment questioning, and request with analyzing a ultra big document. This is because the amount of data that curently increasing with the existence of the internet for wider comunity so that it can be said that the larger number of documents is considered a new oil mining. (Mukherjee, S., 2021).
ID : Menurut Mukherjee, S. (2021), Analisa Sentimen merupakan salah satu bagian dari Bahasa Pengolahan Alami dan Ekstraksi Informasi yang disajikan untuk mendapatkan apa yang penulis rasakan dalam komentar positif atau negatif, pertanyaan, dan permintaan, dengan menganalisa sebuah dokumen yang sangat besar. Hal ini dikarenakan jumlah data yang saat ini semakin banyak dengan adanya Internet untuk masyarakat luas sehingga dapat dikatakan banyaknya jumlah dokumen tersebut dianggap sebagai ladang tambang minyak baru.

What is Virtual Youtuber? / Apa itu Virtual Youtuber?

EN : Virtual Youtuber came from 2 word from English,, Virtual in Cambridge Dictionary is appearance with using computer hardware (for ex. Internet), but isn't visible in real life; and Youtuber in Cambridge Dictionary is someone who using Youtube Platform, especially someone who create and appearance in video on that platform. othherwise, based from virtualhumans.org, Virtual Youtuber is someone in Virtual World who brodcasting their life on popular video platform. Also, Lu, Z. (2021) said Virtyual Youtuber is a Virtual Animation Avatar which bring their life in live streaming video or recorded video. This voiced with an actor who references as a Nakanohito (中の人)* in Japan.
ID : Virtual Youtuber berasal dari 2 kata yang berasal dari bahasa inggris, Virtual dalam cambridge dictionary yang berarti tampil atau hadir dengan menggunakan perangkat lunak komputer, misalnya di internet, namun tak tampak dalam dunia nyata; dan Youtuber dalam cambridge dictionary merupakan seseorang yang menggunakan platform YouTube, terutama seseorang yang membuat dan tampil dalam video pada platform tersebut. Selain itu, dilansir dari situs virtualhumans.org, Virtual Youtuber adalah Seseorang dalam dunia virtual dimana menyiarkan kehidupannya pada platform video yang populer. Selain itu, Lu, Z. (2021) menyatakan bahwa Virtual Youtuber merupakan sebuah animasi avatar virtual yang membawa penampilannya dalam siaran langsung vidio atau vidio yang sudah direkam. Avatar tersebut disulih suarakan oleh seorang aktor, yang dimana mereferensikan sebagai seorang Nakanohito (中の人) di Jepang.

Why Twitter? / Kenapa Twitter?

EN : Twitter is one of micro-blogging media and social media which can influence popularity since last decade where with over 131 million active user and more than 500 million post per day, and Twitter also one of the best way to increase social relationship with friend, family, and colleague (Doshi, Z., et all, 2017). Twitter also have API where easy to getting data
ID : Twitter merupakan salah satu media micro-blogging dan media sosial yang dapat penyebar popularitasnya sejak akhir dekade dimana dengan lebih dari 131 juta pengguna aktif dan lebih dari 500 juta post per harinya, dan Twitter juga merupakan salah satu cara yang terbaik untuk meningkatkan hubungan sosial terhadap teman, keluarga, dan kolega (Doshi, Z., dkk, 2017). Twitter sendiri yang memiliki API yang mudah untuk menarik data.

Project Focus / Fokus Projek

EN : In this project, theres 8346 data from twitter with keyword @EvelynVtuber, @airaniiofifteen, @MythiaVTuber, #holoID, #Hololive, #HololiveID, #IDVtuber, #NIJISANJI_ID, #VtuberID, #Vtuber, kobokanaeru, vtuber indonesia, dan Virtual Youtuber Indonesia. This data has been scrapping with Tweepy from 31 march 2022 – 14 april 2022 and 8 july – 14 july 2022. However in Training datasets section, Random Oversampling (ROS) has been Applied due imbalanced data after data annotation step. In this project, Python is main language with Jupyter Notebook (.ipynb) as python interpreter beside .py a data scrapping.
ID :Pada project ini, digunakan sebesar 8346 data yang berasal dari twitter dengan kata kunci @EvelynVtuber, @airaniiofifteen, @MythiaVTuber, #holoID, #Hololive, #HololiveID, #IDVtuber, #NIJISANJI_ID, #VtuberID, #Vtuber, kobokanaeru, vtuber indonesia, dan Virtual Youtuber Indonesia. Data tersebut diambil dengan bantuan Tweepy pada tanggal 31 maret 2022 – 14 april 2022 dan 8 juli – 14 juli 2022. Meski begitu. Pada project ini digunakan bahasa pemograman Python dengan bantuan Jupyter Notebook (.ipynb) sebagai python interpreter selain .py pada data scrapping.

Future Development / Pengembangan Selanjutnya

  • Add more datasets (Twitter Premium API/Academic Research API Recommended)
  • Add more Algorythm and Classifier (esp CategoricalNB which have major failure)
  • GUI development (web based)
  • Efficiency Preprocessing

additional info

*Nakanohito = Seiyuu; Voice Actor/Actress

About

This project was used for my undergraduate thesis in Education of System and Information Technology, Indonesia University of Education (Purwakarta branch)

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published