Как да изтеглите & Инсталирайте NLTK на Windows / Mac

Съдържание:

Anonim

В този урок ще научите -

  • Инсталиране на NLTK в Windows
  • Инсталиране на Python в Windows
  • Инсталиране на NLTK в Mac / Linux
  • Инсталиране на NLTK чрез Anaconda
  • NLTK набор от данни
  • Как да изтеглите всички пакети на NLTK
  • Стартиране на NLP Script
  • Как да стартирам NLTK Script

Инсталиране на NLTK в Windows

В тази част ще научим, че как да направим настройка NLTK чрез терминал (Команден ред в Windows).

Инструкциите, дадени по-долу, се основават на предположението, че нямате инсталиран python. И така, първата стъпка е да инсталирате python.

Инсталиране на Python в Windows:

Стъпка 1) Отидете да се свържат https://www.python.org/downloads/ , и изберете най-новата версия на Windows.

Забележка : Ако не искате да изтеглите най-новата версия, можете да посетите раздела за изтегляне и да видите всички версии.

Стъпка 2) Кликнете върху Изтегления файл

Стъпка 3) Изберете Персонализиране на инсталацията

Стъпка 4) Щракнете НАСЛЕД

Стъпка 5) В следващия екран

  1. Изберете разширените опции
  2. Дайте персонализирано място за инсталиране. В моя случай папката на C устройство е избрана за по-лесна работа
  3. Щракнете върху Инсталиране

Стъпка 6) Щракнете върху бутона Затвори, след като инсталирането приключи.

Стъпка 7) Копирайте пътя на вашата папка Скриптове.

Стъпка 8) В командния ред на Windows

  • Придвижете се до местоположението на папката pip
  • Въведете команда, за да инсталирате NLTK
    pip3 install nltk
  • Инсталацията трябва да се извърши успешно

ЗАБЕЛЕЖКА : За Python2 използвайте командата pip2 install nltk

Стъпка 9) В менюто "Старт" на Windows потърсете и отворете PythonShell

Стъпка 10) Можете да проверите дали инсталацията е точна, като предоставите командата по-долу

import nltk

Ако не видите грешка, инсталацията е завършена.

Инсталиране на NLTK в Mac / Linux

Инсталирането на NLTK в Mac / Unix изисква python мениджър на пакети за инсталиране на nltk. Ако pip не е инсталиран, моля, следвайте инструкциите по-долу, за да завършите процеса

Стъпка 1) Актуализирайте индекса на пакета, като напишете командата по-долу

sudo apt update

Стъпка 2) Инсталиране на pip за Python 3:

sudo apt install python3-pip

Можете също да инсталирате pip с помощта на easy_install.

sudo apt-get install python-setuptools python-dev build-essential 

Сега е инсталирана easy_install. Изпълнете командата по-долу, за да инсталирате pip

sudo easy_install pip

Стъпка 3) Използвайте следната команда, за да инсталирате NLTK

sudo pip install -U nltksudo pip3 install -U nltk

Инсталиране на NLTK чрез Anaconda

Стъпка 1) Моля, инсталирайте anaconda (която може да се използва и за инсталиране на различни пакети), като посетите https://www.anaconda.com/products/individual и изберете коя версия на python трябва да инсталирате за anaconda.

Забележка: Вижте този урок за подробни стъпки за инсталиране на anaconda

Стъпка 2) В подкана Anaconda,

  1. Въведете команда
    conda install -c anaconda nltk
  2. Прегледайте надстройката на пакета, понижете версията, инсталирайте информацията и въведете да
  3. NLTK се изтегля и инсталира

NLTK набор от данни

Модулът NLTK разполага с много набори от данни, които трябва да изтеглите, за да ги използвате. По-технически се нарича корпус . Някои от примерите са стоп думи , gutenberg , framenet_v15 , large_grammars и така нататък.

Как да изтеглите всички пакети на NLTK

Стъпка 1) Стартирайте интерпретатора на Python в Windows или Linux

Стъпка 2)

  1. Въведете командите
import nltknltk.download ()
  1. Отваря се изтегленият прозорец на NLTK. Щракнете върху бутона за изтегляне, за да изтеглите набора от данни. Този процес ще отнеме време въз основа на вашата интернет връзка

ЗАБЕЛЕЖКА: Можете да промените местоположението за изтегляне, като щракнете върху File> Change Download Directory

Стъпка 3) За да тествате инсталираните данни, използвайте следния код

>>> from nltk.corpus import brown>>>brown.words()

['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', ...]

Стартиране на NLP Script

Ще обсъдим как ще се изпълни NLP скриптът на нашия локален компютър. На пазара има много библиотеки за обработка на естествен език. Така че изборът на библиотека зависи от съобразяването с вашите изисквания. Ето списъка на NLP библиотеките.

Как да стартирам NLTK Script

Стъпка1) В любимия си редактор на код, копирайте кода и запазете файла като " NLTKsample.py "

from nltk.tokenize import RegexpTokenizertokenizer = RegexpTokenizer(r'\w+')filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')print(filterdText)

Обяснение на кода:

  1. В тази програма целта беше да се премахнат всички видове пунктуации от дадения текст. Внесохме "RegexpTokenizer", който е модул на NLTK. Той премахва всички изрази, символи, символи, цифри или всякакви неща, каквито искате.
  2. Току-що сте предали обикновения израз на модула "RegexpTokenizer".
  3. Освен това маркирахме думата с помощта на модула „tokenize“. Резултатът се съхранява в променливата "filterdText".
  4. И ги отпечата с помощта на "print ()."

Стъпка2) В командния ред

  • Придвижете се до мястото, където сте запазили файла
  • Изпълнете командата Python NLTKsample.py

Това ще покаже изхода като:

[„Здравей“, „Guru99“, „Ти“, „имаш“, „изграждаш“, „а“, „много“, „добър“, „сайт“, „и“, „Аз“, „любов“, „ посещение ',' вашия ',' сайт ']