Итак, я написал код ниже, чтобы извлечь хэштеги, а также теги с «@», а затем добавить их в список и отсортировать в порядке убывания. Дело в том, что текст может быть не идеально отформатирован и не иметь пробелов между каждым отдельным хэштегом, и может возникнуть следующая проблема, поскольку это может быть проверено с помощью оператора #print внутри цикла for: #socality#thisismycommunity#themoderndayexplorer #modernoutdoors#mountaincultureelevated
Итак, метод .split() с ними не работает. Что было бы наилучшей практикой для решения этой проблемы?
Благодарен за ваше время.
name = input("Enter file:")
if len(name) < 1 : name = "tags.txt"
handle = open(name)
tags = dict()
lst = list()
for line in handle :
hline = line.split()
for word in hline:
if word.startswith('@') : tags[word] = tags.get(word,0) + 1
else :
tags[word] = tags.get(word,0) + 1
#print(word)
for k,v in tags.items() :
tags_order = (v,k)
lst.append(tags_order)
lst = sorted(lst, reverse=True)[:34]
print('Final Dictionary: ' , '\n')
for v,k in lst :
print(k , v, '')