Подсчет количества слов(вхождений) и символов в текстовом файле в Python
Вы можете подсчитать количество слов в текстовом файле в Python, выполнив последовательность шагов, которые мы обсудим в этом руководстве.
Чтобы подсчет количества слов, выполните следующие действия:
- Откройте файл в режиме чтения и обработайте его в текстовом режиме.
- Прочтите текст с помощью функции read().
- Разделите текст, используя разделитель пробелов. Мы предполагаем, что слова в предложении разделены пробелом.
- Длина разделенного списка должна равняться количеству слов в текстовом файле.
- Вы можете уточнить счет, очистив строку перед разделением или проверив слова после разделения.
Пример 1
В этом примере в Python мы прочитаем текстовый файл и посчитаем количество слов в нем. Рассмотрим следующий текстовый файл.
Welcome to tonais.ru. Here, you will find python programs for all general use cases.
file = open("C:\data.txt", "rt")
data = file.read()
words = data.split()
print('Number of words in text file :', len(words))
Вывод:
Number of words in text file : 14
Пример 2: с несколькими строками
В этом примере мы прочитаем текстовый файл с несколькими строками и посчитаем количество слов в нем. Рассмотрим следующий текстовый файл.
Символ новой строки разделяет строки в текстовом файле. Новая строка – это пробел, и когда мы разделяем все данные в текстовом файле с помощью метода split(), все слова во всех предложениях разбиваются и возвращаются в виде единого списка.
Welcome to tonais.ru. Here, you will find python programs for all general use cases. This is another line with some words.
file = open("C:\data.txt", "rt")
data = file.read()
words = data.split()
print('Number of words in text file :', len(words))
Вывод:
Number of words in text file : 21
Подсчет количества символов в текстовом файле
Сначала прочитаем текст в переменной, а затем сосчитаем символы, выполнив следующие действия:
- Откройте файл в режиме чтения.
- Прочтите текст с помощью функции read().
- Получите длину строки, которая должна быть количеством символов в текстовом файле.
- Вы можете уточнить счет, очистив строку, например удалив пробелы и знаки препинания.
Пример подсчета
Рассмотрим следующий текстовый файл.
Welcome to www.pythonexamples.org. Here, you will find python programs for all general use cases.
#open file in read mode
file = open("C:\data.txt", "r")
#read the content of file
data = file.read()
#get the length of the data
number_of_characters = len(data)
print('Number of characters in text file :', number_of_characters)
Вывод:
Number of characters in text file : 97
Пример 2: без учета пробелов
В этом примере мы прочитаем сам файл и подсчитаем количество символов в нем, исключая символы пробела. Рассмотрим следующий текстовый файл.
Welcome to www.pythonexamples.org. Here, you will find python programs for all general use cases.
#open file in read mode
file = open("C:\data.txt", "r")
#read the content of file and replace spaces with nothing
data = file.read().replace(" ","")
#get the length of the data
number_of_characters = len(data)
print('Number of characters in text file :', number_of_characters)
Вывод:
Number of characters in text file : 84
Чтобы подсчитать количество вхождений определенного слова в текстовый файл, прочтите содержимое текстового файла в строку и используйте функцию String.count() со словом, переданным в качестве аргумента.
Синтаксис
Ниже приводится синтаксис функции count():
n = String.count(word)
Где, word – это строка, а count() возвращает количество вхождений слова в эту строку.
Пример count()
В этом примере мы рассмотрим следующий текстовый файл и посчитаем количество вхождений слова «python».
Welcome to tonais.ru. Here, you will find python programs for all general use cases.
#get file object reference to the file
file = open("C:\workspace\python\data.txt", "r")
#read content of file to string
data = file.read()
#get number of occurrences of the substring in the string
occurrences = data.count("python")
print('Number of occurrences of the word :', occurrences)
Вывод:
Number of occurrences of the word : 1
Автор