В този урок ще научите -
- Инсталиране на NLTK в Windows
- Инсталиране на Python в Windows
- Инсталиране на NLTK в Mac / Linux
- Инсталиране на NLTK чрез Anaconda
- NLTK набор от данни
- Как да изтеглите всички пакети на NLTK
- Стартиране на NLP Script
- Как да стартирам NLTK Script
Инсталиране на NLTK в Windows
В тази част ще научим, че как да направим настройка NLTK чрез терминал (Команден ред в Windows).
Инструкциите, дадени по-долу, се основават на предположението, че нямате инсталиран python. И така, първата стъпка е да инсталирате python.
Инсталиране на Python в Windows:
Стъпка 1) Отидете да се свържат https://www.python.org/downloads/ , и изберете най-новата версия на Windows.
Забележка : Ако не искате да изтеглите най-новата версия, можете да посетите раздела за изтегляне и да видите всички версии.
Стъпка 2) Кликнете върху Изтегления файл
Стъпка 3) Изберете Персонализиране на инсталацията
Стъпка 4) Щракнете НАСЛЕД
Стъпка 5) В следващия екран
- Изберете разширените опции
- Дайте персонализирано място за инсталиране. В моя случай папката на C устройство е избрана за по-лесна работа
- Щракнете върху Инсталиране
Стъпка 6) Щракнете върху бутона Затвори, след като инсталирането приключи.
Стъпка 7) Копирайте пътя на вашата папка Скриптове.
Стъпка 8) В командния ред на Windows
- Придвижете се до местоположението на папката pip
- Въведете команда, за да инсталирате NLTK
pip3 install nltk
- Инсталацията трябва да се извърши успешно
ЗАБЕЛЕЖКА : За Python2 използвайте командата pip2 install nltk
Стъпка 9) В менюто "Старт" на Windows потърсете и отворете PythonShell
Стъпка 10) Можете да проверите дали инсталацията е точна, като предоставите командата по-долу
import nltk
Ако не видите грешка, инсталацията е завършена.
Инсталиране на NLTK в Mac / Linux
Инсталирането на NLTK в Mac / Unix изисква python мениджър на пакети за инсталиране на nltk. Ако pip не е инсталиран, моля, следвайте инструкциите по-долу, за да завършите процеса
Стъпка 1) Актуализирайте индекса на пакета, като напишете командата по-долу
sudo apt update
Стъпка 2) Инсталиране на pip за Python 3:
sudo apt install python3-pip
Можете също да инсталирате pip с помощта на easy_install.
sudo apt-get install python-setuptools python-dev build-essential
Сега е инсталирана easy_install. Изпълнете командата по-долу, за да инсталирате pip
sudo easy_install pip
Стъпка 3) Използвайте следната команда, за да инсталирате NLTK
sudo pip install -U nltksudo pip3 install -U nltk
Инсталиране на NLTK чрез Anaconda
Стъпка 1) Моля, инсталирайте anaconda (която може да се използва и за инсталиране на различни пакети), като посетите https://www.anaconda.com/products/individual и изберете коя версия на python трябва да инсталирате за anaconda.
Забележка: Вижте този урок за подробни стъпки за инсталиране на anaconda
Стъпка 2) В подкана Anaconda,
- Въведете команда
conda install -c anaconda nltk
- Прегледайте надстройката на пакета, понижете версията, инсталирайте информацията и въведете да
- NLTK се изтегля и инсталира
NLTK набор от данни
Модулът NLTK разполага с много набори от данни, които трябва да изтеглите, за да ги използвате. По-технически се нарича корпус . Някои от примерите са стоп думи , gutenberg , framenet_v15 , large_grammars и така нататък.
Как да изтеглите всички пакети на NLTK
Стъпка 1) Стартирайте интерпретатора на Python в Windows или Linux
Стъпка 2)
- Въведете командите
import nltknltk.download ()
- Отваря се изтегленият прозорец на NLTK. Щракнете върху бутона за изтегляне, за да изтеглите набора от данни. Този процес ще отнеме време въз основа на вашата интернет връзка
ЗАБЕЛЕЖКА: Можете да промените местоположението за изтегляне, като щракнете върху File> Change Download Directory
Стъпка 3) За да тествате инсталираните данни, използвайте следния код
>>> from nltk.corpus import brown>>>brown.words()
['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', ...]
Стартиране на NLP Script
Ще обсъдим как ще се изпълни NLP скриптът на нашия локален компютър. На пазара има много библиотеки за обработка на естествен език. Така че изборът на библиотека зависи от съобразяването с вашите изисквания. Ето списъка на NLP библиотеките.
Как да стартирам NLTK Script
Стъпка1) В любимия си редактор на код, копирайте кода и запазете файла като " NLTKsample.py "
from nltk.tokenize import RegexpTokenizertokenizer = RegexpTokenizer(r'\w+')filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')print(filterdText)
Обяснение на кода:
- В тази програма целта беше да се премахнат всички видове пунктуации от дадения текст. Внесохме "RegexpTokenizer", който е модул на NLTK. Той премахва всички изрази, символи, символи, цифри или всякакви неща, каквито искате.
- Току-що сте предали обикновения израз на модула "RegexpTokenizer".
- Освен това маркирахме думата с помощта на модула „tokenize“. Резултатът се съхранява в променливата "filterdText".
- И ги отпечата с помощта на "print ()."
Стъпка2) В командния ред
- Придвижете се до мястото, където сте запазили файла
- Изпълнете командата Python NLTKsample.py
Това ще покаже изхода като:
[„Здравей“, „Guru99“, „Ти“, „имаш“, „изграждаш“, „а“, „много“, „добър“, „сайт“, „и“, „Аз“, „любов“, „ посещение ',' вашия ',' сайт ']