Spaces:

evaluate-measurement
/

word_length

Running

lvwerra HF Staff commited on Sep 13, 2024

Commit

015b8bb

1 Parent(s): a2a6904

Update Space (evaluate main: b3f3c02c)

Files changed (2) hide show

requirements.txt CHANGED Viewed

	@@ -1,2 +1,2 @@
1	- git+https://github.com/huggingface/evaluate.git@~~eb4dac25d8dd9086efc57aeec07b01c5e5270cca~~
2	nltk~=3.7


1	+ git+https://github.com/huggingface/evaluate.git@b3f3c02ce2d972bc0e59e346b3318ca2f537e060
2	nltk~=3.7

word_length.py CHANGED Viewed

@@ -16,10 +16,19 @@ from statistics import mean
 import datasets
 from nltk import word_tokenize
 import evaluate
 _DESCRIPTION = """
 Returns the average length (in terms of the number of words) of the input data.
 """
@@ -75,7 +84,10 @@ class WordLength(evaluate.Measurement):
     def _download_and_prepare(self, dl_manager):
         import nltk
-        nltk.download("punkt")
     def _compute(self, data, tokenizer=word_tokenize):
         """Returns the average word length of the input data"""

 import datasets
 from nltk import word_tokenize
+from packaging import version
 import evaluate
+if evaluate.config.PY_VERSION < version.parse("3.8"):
+    import importlib_metadata
+else:
+    import importlib.metadata as importlib_metadata
+NLTK_VERSION = version.parse(importlib_metadata.version("nltk"))
 _DESCRIPTION = """
 Returns the average length (in terms of the number of words) of the input data.
 """
     def _download_and_prepare(self, dl_manager):
         import nltk
+        if NLTK_VERSION >= version.Version("3.9.0"):
+            nltk.download("punkt_tab")
+        else:
+            nltk.download("punkt")
     def _compute(self, data, tokenizer=word_tokenize):
         """Returns the average word length of the input data"""