From bfeb478a172913b43892f336a9186ede91510fa3 Mon Sep 17 00:00:00 2001
From: ivan <menshikh.iv@gmail.com>
Date: Thu, 31 Aug 2017 19:37:24 +0500
Subject: [PATCH 1/8] fix type in mallet wrapper

---
 gensim/models/wrappers/ldamallet.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/gensim/models/wrappers/ldamallet.py b/gensim/models/wrappers/ldamallet.py
index ab4cdc4adf..c93af78a1a 100644
--- a/gensim/models/wrappers/ldamallet.py
+++ b/gensim/models/wrappers/ldamallet.py
@@ -183,7 +183,7 @@ def __getitem__(self, bow, iterations=100):
 
     def load_word_topics(self):
         logger.info("loading assigned topics from %s", self.fstate())
-        word_topics = numpy.zeros((self.num_topics, self.num_terms), dtype=numpy.float32)
+        word_topics = numpy.zeros((self.num_topics, self.num_terms), dtype=numpy.float64)
         if hasattr(self.id2word, 'token2id'):
             word2id = self.id2word.token2id
         else:

From ed1065ab361cf61f38b80a2858c77b79ba1ec782 Mon Sep 17 00:00:00 2001
From: ivan <menshikh.iv@gmail.com>
Date: Thu, 31 Aug 2017 19:38:00 +0500
Subject: [PATCH 2/8] fix tests for sklearn wrapper

---
 gensim/test/test_sklearn_api.py | 10 +++++-----
 1 file changed, 5 insertions(+), 5 deletions(-)

diff --git a/gensim/test/test_sklearn_api.py b/gensim/test/test_sklearn_api.py
index d990cc403e..b71fa5bf68 100644
--- a/gensim/test/test_sklearn_api.py
+++ b/gensim/test/test_sklearn_api.py
@@ -855,23 +855,23 @@ def testTransform(self):
         doc = self.corpus[0]
         transformed_doc = self.model.transform(doc)
         expected_doc = [[0.81043386270128193, 0.049357139518070477, 0.035840906753517532, 0.026542006926698079, 0.019925705902962578, 0.014776690981729117, 0.011068909979528148]]
-        self.assertTrue(numpy.allclose(transformed_doc, expected_doc))
+        self.assertTrue(numpy.allclose(transformed_doc, expected_doc, atol=1e-1))
 
         # tranform multiple documents
         docs = [self.corpus[0], self.corpus[1]]
         transformed_docs = self.model.transform(docs)
         expected_docs = [[0.81043386270128193, 0.049357139518070477, 0.035840906753517532, 0.026542006926698079, 0.019925705902962578, 0.014776690981729117, 0.011068909979528148],
             [0.0368655605, 0.709055041, 0.194436428, 0.0151706795, 0.0113863652, 1.00000000e-12, 1.00000000e-12]]
-        self.assertTrue(numpy.allclose(transformed_docs[0], expected_docs[0]))
-        self.assertTrue(numpy.allclose(transformed_docs[1], expected_docs[1]))
+        self.assertTrue(numpy.allclose(transformed_docs[0], expected_docs[0], atol=1e-1))
+        self.assertTrue(numpy.allclose(transformed_docs[1], expected_docs[1], atol=1e-1))
 
     def testPartialFit(self):
         for i in range(10):
             self.model.partial_fit(X=self.corpus)  # fit against the model again
             doc = list(self.corpus)[0]  # transform only the first document
             transformed = self.model.transform(doc)
-        expected = numpy.array([0.76777752, 0.01757334, 0.01600339, 0.01374061, 0.01275931, 0.01126313, 0.01058131, 0.01167185])
-        passed = numpy.allclose(sorted(transformed[0]), sorted(expected), atol=1e-1)
+        expected = [0.76777752, 0.01757334, 0.01600339, 0.01374061, 0.01275931, 0.01126313, 0.01058131, 0., 0.01167185]
+        passed = numpy.allclose(transformed[0], expected, atol=1e-1)
         self.assertTrue(passed)
 
     def testSetGetParams(self):

From fb81b76effbcfe8f1ee316fb27d117a3cc7ef84c Mon Sep 17 00:00:00 2001
From: ivan <menshikh.iv@gmail.com>
Date: Thu, 31 Aug 2017 20:13:36 +0500
Subject: [PATCH 3/8] debug commit for test

---
 gensim/test/test_sklearn_api.py | 5 ++++-
 1 file changed, 4 insertions(+), 1 deletion(-)

diff --git a/gensim/test/test_sklearn_api.py b/gensim/test/test_sklearn_api.py
index b71fa5bf68..5fc204e0c4 100644
--- a/gensim/test/test_sklearn_api.py
+++ b/gensim/test/test_sklearn_api.py
@@ -870,7 +870,10 @@ def testPartialFit(self):
             self.model.partial_fit(X=self.corpus)  # fit against the model again
             doc = list(self.corpus)[0]  # transform only the first document
             transformed = self.model.transform(doc)
-        expected = [0.76777752, 0.01757334, 0.01600339, 0.01374061, 0.01275931, 0.01126313, 0.01058131, 0., 0.01167185]
+        expected = numpy.array([0.76777752, 0.01757334, 0.01600339, 0.01374061, 0.01275931, 0.01126313, 0.01058131, 0., 0.01167185])
+        print("###")
+        print(transformed[0])
+        print(expected)
         passed = numpy.allclose(transformed[0], expected, atol=1e-1)
         self.assertTrue(passed)
 

From 368beefde24754c02b7a59ff1d29186f76b6620a Mon Sep 17 00:00:00 2001
From: ivan <menshikh.iv@gmail.com>
Date: Thu, 31 Aug 2017 20:45:11 +0500
Subject: [PATCH 4/8] fix seeding and precision

---
 gensim/test/test_sklearn_api.py | 18 +++++++-----------
 1 file changed, 7 insertions(+), 11 deletions(-)

diff --git a/gensim/test/test_sklearn_api.py b/gensim/test/test_sklearn_api.py
index 5fc204e0c4..8fe41f1670 100644
--- a/gensim/test/test_sklearn_api.py
+++ b/gensim/test/test_sklearn_api.py
@@ -845,8 +845,7 @@ def testModelNotFitted(self):
 
 class TestHdpTransformer(unittest.TestCase):
     def setUp(self):
-        numpy.random.seed(0)
-        self.model = HdpTransformer(id2word=dictionary)
+        self.model = HdpTransformer(id2word=dictionary, random_state=42)
         self.corpus = mmcorpus.MmCorpus(datapath('testcorpus.mm'))
         self.model.fit(self.corpus)
 
@@ -855,26 +854,23 @@ def testTransform(self):
         doc = self.corpus[0]
         transformed_doc = self.model.transform(doc)
         expected_doc = [[0.81043386270128193, 0.049357139518070477, 0.035840906753517532, 0.026542006926698079, 0.019925705902962578, 0.014776690981729117, 0.011068909979528148]]
-        self.assertTrue(numpy.allclose(transformed_doc, expected_doc, atol=1e-1))
+        self.assertTrue(numpy.allclose(transformed_doc, expected_doc, atol=1e-2))
 
         # tranform multiple documents
         docs = [self.corpus[0], self.corpus[1]]
         transformed_docs = self.model.transform(docs)
         expected_docs = [[0.81043386270128193, 0.049357139518070477, 0.035840906753517532, 0.026542006926698079, 0.019925705902962578, 0.014776690981729117, 0.011068909979528148],
-            [0.0368655605, 0.709055041, 0.194436428, 0.0151706795, 0.0113863652, 1.00000000e-12, 1.00000000e-12]]
-        self.assertTrue(numpy.allclose(transformed_docs[0], expected_docs[0], atol=1e-1))
-        self.assertTrue(numpy.allclose(transformed_docs[1], expected_docs[1], atol=1e-1))
+            [0.03795908,  0.39542609,  0.50650585,  0.0151082 ,  0.01132749, 0.,  0.]]
+        self.assertTrue(numpy.allclose(transformed_docs[0], expected_docs[0], atol=1e-2))
+        self.assertTrue(numpy.allclose(transformed_docs[1], expected_docs[1], atol=1e-2))
 
     def testPartialFit(self):
         for i in range(10):
             self.model.partial_fit(X=self.corpus)  # fit against the model again
             doc = list(self.corpus)[0]  # transform only the first document
             transformed = self.model.transform(doc)
-        expected = numpy.array([0.76777752, 0.01757334, 0.01600339, 0.01374061, 0.01275931, 0.01126313, 0.01058131, 0., 0.01167185])
-        print("###")
-        print(transformed[0])
-        print(expected)
-        passed = numpy.allclose(transformed[0], expected, atol=1e-1)
+        expected = numpy.array([0.76777752, 0.01757334, 0.01600339, 0.01374061, 0.01275931, 0.01126313, 0.01058131, 0.01167185])
+        passed = numpy.allclose(transformed[0], expected, atol=1e-2)
         self.assertTrue(passed)
 
     def testSetGetParams(self):

From 2c5e0cd05c934069ed312da564898ddc1507d61e Mon Sep 17 00:00:00 2001
From: ivan <menshikh.iv@gmail.com>
Date: Thu, 31 Aug 2017 21:13:47 +0500
Subject: [PATCH 5/8] fix pep8 & try to fix unreproducable error

---
 gensim/test/test_sklearn_api.py | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/gensim/test/test_sklearn_api.py b/gensim/test/test_sklearn_api.py
index 8fe41f1670..afc8ae63f8 100644
--- a/gensim/test/test_sklearn_api.py
+++ b/gensim/test/test_sklearn_api.py
@@ -845,6 +845,7 @@ def testModelNotFitted(self):
 
 class TestHdpTransformer(unittest.TestCase):
     def setUp(self):
+        numpy.random.seed(0)
         self.model = HdpTransformer(id2word=dictionary, random_state=42)
         self.corpus = mmcorpus.MmCorpus(datapath('testcorpus.mm'))
         self.model.fit(self.corpus)
@@ -860,7 +861,7 @@ def testTransform(self):
         docs = [self.corpus[0], self.corpus[1]]
         transformed_docs = self.model.transform(docs)
         expected_docs = [[0.81043386270128193, 0.049357139518070477, 0.035840906753517532, 0.026542006926698079, 0.019925705902962578, 0.014776690981729117, 0.011068909979528148],
-            [0.03795908,  0.39542609,  0.50650585,  0.0151082 ,  0.01132749, 0.,  0.]]
+            [0.03795908, 0.39542609, 0.50650585, 0.0151082, 0.01132749, 0., 0.]]
         self.assertTrue(numpy.allclose(transformed_docs[0], expected_docs[0], atol=1e-2))
         self.assertTrue(numpy.allclose(transformed_docs[1], expected_docs[1], atol=1e-2))
 

From 416ef250fa02369b4db8736707bbe2a0cc962663 Mon Sep 17 00:00:00 2001
From: ivan <menshikh.iv@gmail.com>
Date: Thu, 31 Aug 2017 22:57:32 +0500
Subject: [PATCH 6/8] debug unreproduced error

---
 gensim/test/test_sklearn_api.py | 3 +++
 1 file changed, 3 insertions(+)

diff --git a/gensim/test/test_sklearn_api.py b/gensim/test/test_sklearn_api.py
index afc8ae63f8..0729393d11 100644
--- a/gensim/test/test_sklearn_api.py
+++ b/gensim/test/test_sklearn_api.py
@@ -871,6 +871,9 @@ def testPartialFit(self):
             doc = list(self.corpus)[0]  # transform only the first document
             transformed = self.model.transform(doc)
         expected = numpy.array([0.76777752, 0.01757334, 0.01600339, 0.01374061, 0.01275931, 0.01126313, 0.01058131, 0.01167185])
+        print("#####")
+        print(transformed[0])
+        print(expected)
         passed = numpy.allclose(transformed[0], expected, atol=1e-2)
         self.assertTrue(passed)
 

From ed261d67753af1e4743b70d0b0a2190c85a39dee Mon Sep 17 00:00:00 2001
From: ivan <menshikh.iv@gmail.com>
Date: Fri, 1 Sep 2017 17:08:04 +0500
Subject: [PATCH 7/8] fix test

---
 gensim/test/test_sklearn_api.py | 8 ++++----
 1 file changed, 4 insertions(+), 4 deletions(-)

diff --git a/gensim/test/test_sklearn_api.py b/gensim/test/test_sklearn_api.py
index 0729393d11..0973a8fa1e 100644
--- a/gensim/test/test_sklearn_api.py
+++ b/gensim/test/test_sklearn_api.py
@@ -866,11 +866,11 @@ def testTransform(self):
         self.assertTrue(numpy.allclose(transformed_docs[1], expected_docs[1], atol=1e-2))
 
     def testPartialFit(self):
-        for i in range(10):
+        for i in range(5):
             self.model.partial_fit(X=self.corpus)  # fit against the model again
-            doc = list(self.corpus)[0]  # transform only the first document
-            transformed = self.model.transform(doc)
-        expected = numpy.array([0.76777752, 0.01757334, 0.01600339, 0.01374061, 0.01275931, 0.01126313, 0.01058131, 0.01167185])
+
+        transformed = self.model.transform(list(self.corpus)[0])
+        expected = numpy.array([0.77901173, 0.0232508, 0.02054655, 0.01769651, 0.01600487, 0.01478038, 0.01237056, 0.01194372, 0.01070444])
         print("#####")
         print(transformed[0])
         print(expected)

From f381c1e5433cf4032ed4a84b2751e2057d46cbe1 Mon Sep 17 00:00:00 2001
From: ivan <menshikh.iv@gmail.com>
Date: Fri, 1 Sep 2017 17:35:16 +0500
Subject: [PATCH 8/8] remove debug output

---
 gensim/test/test_sklearn_api.py | 3 ---
 1 file changed, 3 deletions(-)

diff --git a/gensim/test/test_sklearn_api.py b/gensim/test/test_sklearn_api.py
index 0973a8fa1e..997b3d9fb1 100644
--- a/gensim/test/test_sklearn_api.py
+++ b/gensim/test/test_sklearn_api.py
@@ -871,9 +871,6 @@ def testPartialFit(self):
 
         transformed = self.model.transform(list(self.corpus)[0])
         expected = numpy.array([0.77901173, 0.0232508, 0.02054655, 0.01769651, 0.01600487, 0.01478038, 0.01237056, 0.01194372, 0.01070444])
-        print("#####")
-        print(transformed[0])
-        print(expected)
         passed = numpy.allclose(transformed[0], expected, atol=1e-2)
         self.assertTrue(passed)