Yash Bahirat Patil - Posts

import nltk
nltk.download('all')
from nltk.tokenize import word_tokenize
from nltk.corpus import stopwords
from wordcloud import WordCloud
import matplotlib.pyplot as plt
text="""
Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean commodo ligula eget dolor.
Aenean massa. ***** sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus
mus. Donec quam felis, ultricies nec, pellentesque eu, pretium quis, sem.
Nulla consequat massa quis enim. Donec pede justo, fringilla vel, aliquet nec, vulputate
"""
tokenized_words=word_tokenize(text)
tokenized_words
stop_words_data=set(stopwords.words("english"))
filtered_words_list=[]
for words in tokenized_words:
if words not in stop_words_data:
filtered_words_list.append(words)
print("Tokenized Words : \n",tokenized_words ,"\n ")
print("Filtered Words : \n",filtered_words_list ,"\n ")
unique_string=(" ").join(filtered_words_list)
wordcloud=WordCloud(width=1000,height=500).generate(unique_string)
plt.figure(figsize=(15,8))
plt.imshow(wordcloud)
plt.axis("off")
plt.savefig("your_file_name"+"png",bbox_inches='tight')
plt.show()
plt.close()