yapf

orsinium-archive · Feb 9, 2018 · c8ed814 · c8ed814
1 parent 2876f94
commit c8ed814
Show file tree

Hide file tree

Showing 11 changed files with 746 additions and 743 deletions.
diff --git a/.style.yapf b/.style.yapf
@@ -0,0 +1,5 @@
+[style]
+based_on_style = pep8
+indent_width = 4
+spaces_before_comment = 1
+column_limit = 120
diff --git a/manual_test.py b/manual_test.py
@@ -1,12 +1,12 @@
 from rutimeparser import parse_time, get_clear_text, get_last_clear_text
 
 if __name__ == '__main__':
-	for test in open('test_strings', 'r'):
-		print(test.strip(), '\x1B[31m', parse_time(test), '\x1B[0m')
-	
-	while 1:
-		text = input('> ')
-		print('Time:  \x1B[32m', parse_time(text), '\x1B[0m')
-		print('Moscow:\x1B[32m', parse_time(text, tz='Europe/Moscow'), '\x1B[0m')
-		print('Text:  \x1B[32m', get_clear_text(text), '\x1B[0m')
-		print('Last:  \x1B[33m ', get_last_clear_text(text), '\x1B[0m')
+    for test in open('test_strings', 'r'):
+        print(test.strip(), '\x1B[31m', parse_time(test), '\x1B[0m')
+
+    while 1:
+        text = input('> ')
+        print('Time:  \x1B[32m', parse_time(text), '\x1B[0m')
+        print('Moscow:\x1B[32m', parse_time(text, tz='Europe/Moscow'), '\x1B[0m')
+        print('Text:  \x1B[32m', get_clear_text(text), '\x1B[0m')
+        print('Last:  \x1B[33m ', get_last_clear_text(text), '\x1B[0m')
diff --git a/rutimeparser/__init__.py b/rutimeparser/__init__.py
@@ -7,175 +7,175 @@
 
 
 class TimeParser:
-	'''
+    '''
 	Класс для получения из текста на естественном языке даты и времени.
 	Возвращает datetime, date или None.
 	'''
-	
-	def __init__(self, text='', words=None, tz=None, now=None):
-		if not words:
-			if not text:
-				raise ValueError('Please, set text or words for TimeParser.')
-			self.words = tuple(get_words(text))
-		else:
-			self.words = words
-		
-		self.tz = tz
-		self.now = now if now else get_now(self.tz)
-		
-		if not self.tz and now and now.tzinfo:
-			self.tz = str(dt.tzinfo)
-	
-	def make_nodes(self):
-		'''
+
+    def __init__(self, text='', words=None, tz=None, now=None):
+        if not words:
+            if not text:
+                raise ValueError('Please, set text or words for TimeParser.')
+            self.words = tuple(get_words(text))
+        else:
+            self.words = words
+
+        self.tz = tz
+        self.now = now if now else get_now(self.tz)
+
+        if not self.tz and now and now.tzinfo:
+            self.tz = str(dt.tzinfo)
+
+    def make_nodes(self):
+        '''
 		Генерирует список нод на основе слов исходного текста
 		'''
-		self.nodes = []
-		for i, word in enumerate(self.words):
-			cat, value = get_cat(word, self.now)
-			self.nodes.append(Node(i, cat, word, value))
-		return self.nodes
-	
-	def get_nodes_by_template(self, *template):
-		'''
+        self.nodes = []
+        for i, word in enumerate(self.words):
+            cat, value = get_cat(word, self.now)
+            self.nodes.append(Node(i, cat, word, value))
+        return self.nodes
+
+    def get_nodes_by_template(self, *template):
+        '''
 		Возвращает списки нод, соответствующих переданному списку категорий
 		'''
-		
-		def test(nodes, template):
-			'''
+
+        def test(nodes, template):
+            '''
 			Проверяет список нод на соответствие шаблону
 			'''
-			if len(nodes) < len(template):
-				return False
-			for node, cat in zip(nodes, template):
-				if node.cat != cat:
-					return False
-			return True
-		
-		n = len(template)
-		for nodes in ngrams(self.nodes, n):
-			if test(nodes, template):
-				yield nodes
-	
-	def replace(self, node_from, node_to, new_node):
-		'''
+            if len(nodes) < len(template):
+                return False
+            for node, cat in zip(nodes, template):
+                if node.cat != cat:
+                    return False
+            return True
+
+        n = len(template)
+        for nodes in ngrams(self.nodes, n):
+            if test(nodes, template):
+                yield nodes
+
+    def replace(self, node_from, node_to, new_node):
+        '''
 		Заменяет диапазон нод новой нодой
 		'''
-		new_nodes = []
-		for node in self.nodes:
-			if node.i < node_from.i or node.i > node_to.i:
-				new_nodes.append(node)
-			elif node.i == node_from.i:
-				new_nodes.append(new_node)
-		self.nodes = new_nodes
-		return new_nodes
-	
-	def get_junk_chains(self):
-		chains = []
-		chain = []
-		for node in self.nodes:
-			if node.cat == 'junk':
-				chain.append(node)
-			else:
-				chains.append(chain)
-				chain = []
-		chains.append(chain)
-		
-		good_chains = []
-		for chain in chains:
-			if len(chain) > 2 or any([len(node.word) > 3 for node in chain]):
-				good_chains.append(chain)
-		return good_chains
-	
-	def remove_junk(self):
-		'''
+        new_nodes = []
+        for node in self.nodes:
+            if node.i < node_from.i or node.i > node_to.i:
+                new_nodes.append(node)
+            elif node.i == node_from.i:
+                new_nodes.append(new_node)
+        self.nodes = new_nodes
+        return new_nodes
+
+    def get_junk_chains(self):
+        chains = []
+        chain = []
+        for node in self.nodes:
+            if node.cat == 'junk':
+                chain.append(node)
+            else:
+                chains.append(chain)
+                chain = []
+        chains.append(chain)
+
+        good_chains = []
+        for chain in chains:
+            if len(chain) > 2 or any([len(node.word) > 3 for node in chain]):
+                good_chains.append(chain)
+        return good_chains
+
+    def remove_junk(self):
+        '''
 		Удаляет из текста все слова, не связанные с датой и временем
 		'''
-		self.nodes = [node for node in self.nodes if node.cat != 'junk']
-	
-	def reduce(self):
-		'''
+        self.nodes = [node for node in self.nodes if node.cat != 'junk']
+
+    def reduce(self):
+        '''
 		Объединяет несколько нод в одну по заданным правилам
 		'''
-		for f, *template in templates:
-			nodes_samples = list(self.get_nodes_by_template(*template))
-			for nodes in nodes_samples:
-				new_node = f(nodes, now=self.now)
-				self.replace(nodes[0], nodes[-1], new_node)
-	
-	def __dict__(self):
-		'''
+        for f, *template in templates:
+            nodes_samples = list(self.get_nodes_by_template(*template))
+            for nodes in nodes_samples:
+                new_node = f(nodes, now=self.now)
+                self.replace(nodes[0], nodes[-1], new_node)
+
+    def __dict__(self):
+        '''
 		Возвращает словарь "категория_ноды: значение_ноды"
 		'''
-		return {node.cat: node.value for node in self.nodes}
-	
-	def get_datetime(self):
-		'''
+        return {node.cat: node.value for node in self.nodes}
+
+    def get_datetime(self):
+        '''
 		Возвращает результат на основе обработанных нод
 		'''
-		nodes = self.__dict__()
-		if 'datetime' in nodes:
-			return change_timezone(nodes['datetime'], self.tz)
-		now = datetime.now()
-		if 'date' in nodes and 'time' in nodes:
-			dt = datetime.combine(nodes['date'], nodes['time'])
-			return change_timezone(dt, self.tz)
-		if 'time' in nodes:
-			return datetime.combine(now.date(), nodes['time'])
-		if 'date' in nodes:
-			return nodes['date']
-	
-	def get_clear_text(self):
-		result = []
-		for chain in self.get_junk_chains():
-			for node in chain:
-				result.append(node.word)
-		return ' '.join(result)
-
-	def get_last_clear_text(self):
-		result = []
-		chains = list(self.get_junk_chains())
-		if not chains:
-			return ''
-		chain = chains[-1]
-		return ' '.join([node.word for node in chain])
+        nodes = self.__dict__()
+        if 'datetime' in nodes:
+            return change_timezone(nodes['datetime'], self.tz)
+        now = datetime.now()
+        if 'date' in nodes and 'time' in nodes:
+            dt = datetime.combine(nodes['date'], nodes['time'])
+            return change_timezone(dt, self.tz)
+        if 'time' in nodes:
+            return datetime.combine(now.date(), nodes['time'])
+        if 'date' in nodes:
+            return nodes['date']
+
+    def get_clear_text(self):
+        result = []
+        for chain in self.get_junk_chains():
+            for node in chain:
+                result.append(node.word)
+        return ' '.join(result)
+
+    def get_last_clear_text(self):
+        result = []
+        chains = list(self.get_junk_chains())
+        if not chains:
+            return ''
+        chain = chains[-1]
+        return ' '.join([node.word for node in chain])
 
 
 def parse_time(text, *, tz=None, now=None, remove_junk=True, debug=False):
-	'''
+    '''
 	Для тех, кто не любит классы. Выполняет все необходимые операции
 	с текстом и возвращает результат.
 	'''
-	tp = TimeParser(text, tz=tz, now=now)
-	tp.make_nodes()
-	if debug:
-		from pprint import pprint
-		pprint(tp.nodes)
-	if remove_junk:
-		tp.remove_junk()
-	tp.reduce()
-	return tp.get_datetime()
+    tp = TimeParser(text, tz=tz, now=now)
+    tp.make_nodes()
+    if debug:
+        from pprint import pprint
+        pprint(tp.nodes)
+    if remove_junk:
+        tp.remove_junk()
+    tp.reduce()
+    return tp.get_datetime()
 
 
 def get_clear_text(text, debug=False):
-	'''
+    '''
 	Возвращает фрагменты, не связанные с датой и временем
 	'''
-	tp = TimeParser(text)
-	tp.make_nodes()
-	if debug:
-		from pprint import pprint
-		pprint(tp.nodes)
-	return tp.get_clear_text()
+    tp = TimeParser(text)
+    tp.make_nodes()
+    if debug:
+        from pprint import pprint
+        pprint(tp.nodes)
+    return tp.get_clear_text()
 
 
 def get_last_clear_text(text, debug=False):
-	'''
+    '''
 	Возвращает последний фрагмент, не связанный с датой и временем
 	'''
-	tp = TimeParser(text)
-	tp.make_nodes()
-	if debug:
-		from pprint import pprint
-		pprint(tp.nodes)
-	return tp.get_last_clear_text()
+    tp = TimeParser(text)
+    tp.make_nodes()
+    if debug:
+        from pprint import pprint
+        pprint(tp.nodes)
+    return tp.get_last_clear_text()