Skip to content

Latest commit

Β 

History

History
125 lines (124 loc) Β· 4.92 KB

File metadata and controls

125 lines (124 loc) Β· 4.92 KB

AWS file structure

/nlp_data
|
└── NLP_dhruv_harshit
    |
    β”œβ”€β”€ DataStats_ofChat
    |   |
    β”‚Β Β  β”œβ”€β”€ words_not_in_glove_6B.txt
    β”‚Β Β  β”œβ”€β”€ words_not_in_glove840_cased.txt
    β”‚Β Β  β”œβ”€β”€ words_not_in_glove840.txt
    β”‚Β Β  β”œβ”€β”€ words_not_in_glove_twitter_cased.txt
    β”‚Β Β  └── words_not_in_glove_twitter.txt
    |
    β”œβ”€β”€ emotion_analysis
    |   |    
    β”‚Β Β  β”œβ”€β”€ emotion_analysis.ipynb
    β”‚Β Β  └── imdb_emotions.csv
    |      
    └── sentiment_analysis
        |   
        β”œβ”€β”€ Dataset (Contains the chat dataset & glove)
        |   |
        β”‚Β Β  β”œβ”€β”€ beam_cable_google_tagged_data.json
        β”‚Β Β  β”œβ”€β”€ droom_google_tagged_data.json
        |   |
        β”‚Β Β  β”œβ”€β”€ data.csv
        β”‚Β Β  β”œβ”€β”€ train.csv
        β”‚Β Β  β”œβ”€β”€ test.csv
        β”‚Β Β  β”œβ”€β”€ valid.csv        
        |   |
        β”‚Β Β  β”œβ”€β”€ glove.6B.300d.txt
        β”‚Β Β  β”œβ”€β”€ glove.840B.300d.txt 
        |   |
        β”‚Β Β  β”œβ”€β”€ test_x.pkl
        β”‚Β Β  β”œβ”€β”€ test_y.pkl
        β”‚Β Β  β”œβ”€β”€ train_x.pkl
        β”‚Β Β  β”œβ”€β”€ train_y.pkl
        β”‚Β Β  β”œβ”€β”€ val_x.pkl
        β”‚Β Β  └── val_y.pkl
        |   |
        |   β”œβ”€β”€ Message_VS_sentiment&Emotion - Sheet1.csv
        |   
        β”œβ”€β”€ GloveDataDistribution_4B_and_840B
        β”‚Β Β  |
        β”‚Β Β  β”œβ”€β”€ glove6B
        β”‚Β Β  β”‚Β Β  β”œβ”€β”€ conv_length2count.jpg
        β”‚Β Β  β”‚Β Β  β”œβ”€β”€ create_embedding.ipynb
        β”‚Β Β  β”‚Β Β  β”œβ”€β”€ glove_vocab_comparison.ipynb
        β”‚Β Β  β”‚Β Β  β”œβ”€β”€ no.ofMsgs_vs_scores_afterSubsampling.png
        β”‚Β Β  β”‚Β Β  β”œβ”€β”€ no.ofMsgs_vs_scores_beforeSubsampling.png
        β”‚Β Β  β”‚Β Β  β”œβ”€β”€ no.ofMsgs_vs_scores_both.png
        β”‚Β Β  β”‚Β Β  β”œβ”€β”€ plot_NoOfMsgAboveThreshold_vs_NoOfConversations_HA.ipynb
        β”‚Β Β  β”‚Β Β  β”œβ”€β”€ plot_NoOfMsg_vs_NoOfConversations_And_Polarity_vs_NoOfConversations_DS.ipynb
        β”‚Β Β  β”‚Β Β  β”œβ”€β”€ samarth_data.ipynb
        β”‚Β Β  β”‚Β Β  β”œβ”€β”€ samarth_data.py
        β”‚Β Β  β”‚Β Β  β”œβ”€β”€ score2freq.png
        β”‚Β Β  β”‚Β Β  
        β”‚Β Β  β”œβ”€β”€ glove6B_DataInput_and_DataStats_and_DataDistributionPlot_DS.ipynb
        β”‚Β Β  β”œβ”€β”€ glove6B_DataStats_HA.ipynb
        β”‚Β Β  β”œβ”€β”€ glove6B_OldPreprocessor.ipynb
        β”‚Β Β  β”œβ”€β”€ glove840_vocab_comparison.pyΒ  
        β”‚Β Β  β”œβ”€β”€ vocab_of_chat.txt
        β”‚Β Β  └── words_of_glovetwitter6B.txt
        |
        |   
        β”œβ”€β”€ milestone-1 (IMDB & Feed forward Net)
        β”‚Β Β  β”œβ”€β”€ data
        β”‚Β Β  β”‚Β Β  β”œβ”€β”€ labeledTrainData.tsv
        β”‚Β Β  β”‚Β Β  └── testData.tsv
        β”‚Β Β  β”œβ”€β”€ M1_code .ipynb
        β”‚Β Β  └── sentiment_nn.py
        |
        β”œβ”€β”€ milestone-2 (IMDB & RNN)
        |   |
        β”‚Β Β  β”œβ”€β”€ M2_code-harshit.ipynb
        β”‚Β Β  β”œβ”€β”€ M2_code.ipynb
        β”‚Β Β  β”œβ”€β”€ M2_code.py
        |
        β”œβ”€β”€ milestone-3 (Chat & RNN & GloVe.6B)
        |   |
        β”‚Β Β  β”œβ”€β”€ data_input.ipynb
        β”‚Β Β  β”œβ”€β”€ GeneralityCheck_HS.ipynb
        β”‚Β Β  β”œβ”€β”€ glove840_vocab_comparison.py
        β”‚Β Β  β”œβ”€β”€ M2_code-harshit-without-dropout.ipynb
        β”‚Β Β  β”œβ”€β”€ M2_code-harshit-without-dropout-new+(5).ipynb
        β”‚Β Β  β”œβ”€β”€ M2_code-harshit-without-dropout-new.ipynb
        β”‚Β Β  β”œβ”€β”€ M2_code.ipynb
        β”‚Β Β  └── unique_words.py
        |
        β”œβ”€β”€ milestone-3.5 (Chat & LR)
        β”‚Β Β  β”œβ”€β”€ LR.ipynb
        β”‚Β Β  └── LR.py
        |   
        β”œβ”€β”€ milestone-4 (Chat & GLoVe.840B)
        |   | 
        β”‚Β Β  β”œβ”€β”€ LeftPadding_6B.ipynb
        β”‚Β Β  β”œβ”€β”€ main_hyperparameter_tuning.ipynb
        β”‚Β Β  β”œβ”€β”€ main_hyperparameter_tuning.py
        β”‚Β Β  β”œβ”€β”€ make_pkl_files.py
        β”‚Β Β  β”œβ”€β”€ Make_TrainValTest_pickle.ipynb
        β”‚Β Β  β”œβ”€β”€ samarth_data.ipynb   
        β”‚Β Β  β”‚Β Β  
        β”‚Β Β  └── wrong_result.ipynb
        β”‚
        β”œβ”€β”€ serving (Contains Production code)
        |   β”œβ”€β”€ tensorflow_serving
        |       β”œβ”€β”€ example
        |           β”œβ”€β”€ BUILD
        |           β”œβ”€β”€ sentiment_saved_mode.py
        |           β”œβ”€β”€ sentiment_client.py
        |
        |
        β”œβ”€β”€ Results   (Contains results of Hyperparameter tuning)
        β”‚Β Β  β”œβ”€β”€ Result6B    
        β”‚Β Β  β”œβ”€β”€ Result840B            
        |   β”œβ”€β”€ Results.md
        |   β”œβ”€β”€ FinalReport = https://docs.google.com/document/d/1HlEqMnx75JYu33f9TFHU_EpVRqIOqaX05_EnjXmBVUk/edit
        |   β”œβ”€β”€result sheet = https://docs.google.com/spreadsheets/d/1CdMQFgi3VF_tO60C0EBcSVn9nyZDFxIPCRVJ5xw9G2Y/edit 
        |
        β”œβ”€β”€ FinalCode-part0.ipynb
        β”œβ”€β”€ FinalCode-part1.ipynb
        β”œβ”€β”€ FinalCode-part2.ipynb