{ "cells": [ { "cell_type": "code", "execution_count": 194, "metadata": {}, "outputs": [], "source": [ "import pandas as pd\n", "data = pd.read_csv(\"../data/rawdata.csv\")\n", "data.drop(columns=\"Unnamed: 0\", inplace=True)" ] }, { "cell_type": "code", "execution_count": 195, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
contentscorethumbsUpCountApplication
0Rất thuận tiện, có lợi ích.52Messenger
1Tốt4213Messenger
2Ok51Messenger
3Xài rất tốt , nên tải nha58Messenger
4gútttt51Messenger
...............
310741Ok50Instagram
310742G o o d50Instagram
31074350Instagram
310744Nhiều lúc tôi k lấy đc hiệu ứng10Instagram
310745Tui chưa chơi ko biết có hay ko ??????30Instagram
\n", "

310746 rows × 4 columns

\n", "
" ], "text/plain": [ " content score thumbsUpCount \\\n", "0 Rất thuận tiện, có lợi ích. 5 2 \n", "1 Tốt 4 213 \n", "2 Ok 5 1 \n", "3 Xài rất tốt , nên tải nha 5 8 \n", "4 gútttt 5 1 \n", "... ... ... ... \n", "310741 Ok 5 0 \n", "310742 G o o d 5 0 \n", "310743 Có 5 0 \n", "310744 Nhiều lúc tôi k lấy đc hiệu ứng 1 0 \n", "310745 Tui chưa chơi ko biết có hay ko ?????? 3 0 \n", "\n", " Application \n", "0 Messenger \n", "1 Messenger \n", "2 Messenger \n", "3 Messenger \n", "4 Messenger \n", "... ... \n", "310741 Instagram \n", "310742 Instagram \n", "310743 Instagram \n", "310744 Instagram \n", "310745 Instagram \n", "\n", "[310746 rows x 4 columns]" ] }, "execution_count": 195, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data" ] }, { "cell_type": "code", "execution_count": 3, "metadata": {}, "outputs": [ { "data": { "application/vnd.jupyter.widget-view+json": { "model_id": "77738c473504417bad502941cdd4d650", "version_major": 2, "version_minor": 0 }, "text/plain": [ "Downloading data files: 0%| | 0/3 [00:00\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
contentscorethumbsUpCountApplication
0không làm được11Messenger
1đăng xuất ra vô lại bị lỗi nhìu11Messenger
2cập nhật lại giùm cái52Messenger
31 sao vì chặn mà vẫn gỡ được10Messenger
4sản năm sao luân51Messenger
...............
91994cập nhật không được ạ40Instagram
91995sao ko vô dc50Instagram
91996chụp đẹp nhưng chưa có tính năng giây nha mong...40Instagram
91997điện video bị lỗi10Instagram
91998chụp ảnh lưu về máy xem lại ko có10Instagram
\n", "

91999 rows × 4 columns

\n", "" ], "text/plain": [ " content score \\\n", "0 không làm được 1 \n", "1 đăng xuất ra vô lại bị lỗi nhìu 1 \n", "2 cập nhật lại giùm cái 5 \n", "3 1 sao vì chặn mà vẫn gỡ được 1 \n", "4 sản năm sao luân 5 \n", "... ... ... \n", "91994 cập nhật không được ạ 4 \n", "91995 sao ko vô dc 5 \n", "91996 chụp đẹp nhưng chưa có tính năng giây nha mong... 4 \n", "91997 điện video bị lỗi 1 \n", "91998 chụp ảnh lưu về máy xem lại ko có 1 \n", "\n", " thumbsUpCount Application \n", "0 1 Messenger \n", "1 1 Messenger \n", "2 2 Messenger \n", "3 0 Messenger \n", "4 1 Messenger \n", "... ... ... \n", "91994 0 Instagram \n", "91995 0 Instagram \n", "91996 0 Instagram \n", "91997 0 Instagram \n", "91998 0 Instagram \n", "\n", "[91999 rows x 4 columns]" ] }, "execution_count": 236, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data_output" ] }, { "cell_type": "code", "execution_count": 237, "metadata": {}, "outputs": [], "source": [ "data_output.to_csv(\"../data/clean_data_v2.csv\")" ] }, { "cell_type": "code", "execution_count": null, "metadata": {}, "outputs": [], "source": [] } ], "metadata": { "kernelspec": { "display_name": "base", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.11.4" }, "orig_nbformat": 4 }, "nbformat": 4, "nbformat_minor": 2 }