neuralmagic
diff --git a/‎integrations/huggingface-transformers/tutorials/sentiment-analysis/docs-sentiment-analysis-python-custom-teacher-rottentomatoes.ipynb
+56-36 b/‎integrations/huggingface-transformers/tutorials/sentiment-analysis/docs-sentiment-analysis-python-custom-teacher-rottentomatoes.ipynb
+56-36
diff --git a/‎integrations/huggingface-transformers/tutorials/sentiment-analysis/docs-sentiment-analysis-python-sst2.ipynb
+54-39 b/‎integrations/huggingface-transformers/tutorials/sentiment-analysis/docs-sentiment-analysis-python-sst2.ipynb
+54-39
@@ -60,10 +60,10 @@
     "import numpy as np\n",
     "from transformers import (\n",
     "    AutoModelForSequenceClassification,\n",
-    "    AutoConfig, \n",
-    "    AutoTokenizer, \n",
-    "    EvalPrediction, \n",
-    "    default_data_collator\n",
+    "    AutoConfig,\n",
+    "    AutoTokenizer,\n",
+    "    EvalPrediction,\n",
+    "    default_data_collator,\n",
     ")\n",
     "from datasets import load_dataset, load_metric"
    ]
@@ -96,8 +96,8 @@
     "dataset[\"train\"].to_csv(\"rotten_tomatoes-train.csv\")\n",
     "dataset[\"validation\"].to_csv(\"rotten_tomatoes-validation.csv\")\n",
     "data_files = {\n",
-    "  \"train\": \"rotten_tomatoes-train.csv\",\n",
-    "  \"validation\": \"rotten_tomatoes-validation.csv\"\n",
+    "    \"train\": \"rotten_tomatoes-train.csv\",\n",
+    "    \"validation\": \"rotten_tomatoes-validation.csv\",\n",
     "}\n",
     "dataset_from_json = load_dataset(\"csv\", data_files=data_files)"
    ]
@@ -163,13 +163,14 @@
    "source": [
     "metric = load_metric(\"accuracy\")\n",
     "\n",
+    "\n",
     "def compute_metrics(p: EvalPrediction):\n",
-    "  preds = p.predictions[0] if isinstance(p.predictions, tuple) else p.predictions\n",
-    "  preds = np.argmax(preds, axis=1)\n",
-    "  result = metric.compute(predictions=preds, references=p.label_ids)\n",
-    "  if len(result) > 1:\n",
-    "      result[\"combined_score\"] = np.mean(list(result.values())).item()\n",
-    "  return result"
+    "    preds = p.predictions[0] if isinstance(p.predictions, tuple) else p.predictions\n",
+    "    preds = np.argmax(preds, axis=1)\n",
+    "    result = metric.compute(predictions=preds, references=p.label_ids)\n",
+    "    if len(result) > 1:\n",
+    "        result[\"combined_score\"] = np.mean(list(result.values())).item()\n",
+    "    return result"
    ]
   },
   {
@@ -209,12 +210,16 @@
    "outputs": [],
    "source": [
     "# downloads 90% pruned upstream BERT trained on MLM objective\n",
-    "model_stub = \"zoo:nlp/masked_language_modeling/obert-base/pytorch/huggingface/wikipedia_bookcorpus/pruned90-none\" \n",
-    "model_path = Model(model_stub, download_path=\"./model\").training.path \n",
+    "model_stub = \"zoo:nlp/masked_language_modeling/obert-base/pytorch/huggingface/wikipedia_bookcorpus/pruned90-none\"\n",
+    "model_path = Model(model_stub, download_path=\"./model\").training.path\n",
     "\n",
     "# downloads transfer recipe for MNLI (pruned90_quant)\n",
-    "transfer_stub = \"zoo:nlp/sentiment_analysis/obert-base/pytorch/huggingface/sst2/pruned90_quant-none\"\n",
-    "recipe_path = Model(transfer_stub, download_path=\"./transfer_recipe\").recipes.default.path"
+    "transfer_stub = (\n",
+    "    \"zoo:nlp/sentiment_analysis/obert-base/pytorch/huggingface/sst2/pruned90_quant-none\"\n",
+    ")\n",
+    "recipe_path = Model(\n",
+    "    transfer_stub, download_path=\"./transfer_recipe\"\n",
+    ").recipes.default.path"
    ]
   },
   {
@@ -363,13 +368,23 @@
     "# initialize model using familiar HF AutoModel\n",
     "model_kwargs = {\"config\": model_config}\n",
     "model_kwargs[\"state_dict\"], s_delayed = SparseAutoModel._loadable_state_dict(model_path)\n",
-    "model = AutoModelForSequenceClassification.from_pretrained(model_path,**model_kwargs,)\n",
-    "SparseAutoModel.log_model_load(model, model_path, \"student\", s_delayed) # prints metrics on sparsity profile\n",
+    "model = AutoModelForSequenceClassification.from_pretrained(\n",
+    "    model_path,\n",
+    "    **model_kwargs,\n",
+    ")\n",
+    "SparseAutoModel.log_model_load(\n",
+    "    model, model_path, \"student\", s_delayed\n",
+    ")  # prints metrics on sparsity profile\n",
     "\n",
     "# initialize teacher using familiar HF AutoModel\n",
     "teacher_kwargs = {\"config\": teacher_config}\n",
-    "teacher_kwargs[\"state_dict\"], t_delayed = SparseAutoModel._loadable_state_dict(teacher_path)\n",
-    "teacher = AutoModelForSequenceClassification.from_pretrained(teacher_path,**teacher_kwargs,)\n",
+    "teacher_kwargs[\"state_dict\"], t_delayed = SparseAutoModel._loadable_state_dict(\n",
+    "    teacher_path\n",
+    ")\n",
+    "teacher = AutoModelForSequenceClassification.from_pretrained(\n",
+    "    teacher_path,\n",
+    "    **teacher_kwargs,\n",
+    ")\n",
     "SparseAutoModel.log_model_load(teacher, teacher_path, \"teacher\", t_delayed)"
    ]
   },
@@ -393,22 +408,25 @@
    "outputs": [],
    "source": [
     "MAX_LEN = 128\n",
+    "\n",
+    "\n",
     "def preprocess_fn(examples):\n",
-    "  args = None\n",
-    "  if INPUT_COL_2 is None:\n",
-    "    args = (examples[INPUT_COL_1], )\n",
-    "  else:\n",
-    "    args = (examples[INPUT_COL_1], examples[INPUT_COL_2])\n",
-    "  result = tokenizer(*args, \n",
-    "                   padding=\"max_length\", \n",
-    "                   max_length=min(tokenizer.model_max_length, MAX_LEN), \n",
-    "                   truncation=True)\n",
-    "  return result\n",
+    "    args = None\n",
+    "    if INPUT_COL_2 is None:\n",
+    "        args = (examples[INPUT_COL_1],)\n",
+    "    else:\n",
+    "        args = (examples[INPUT_COL_1], examples[INPUT_COL_2])\n",
+    "    result = tokenizer(\n",
+    "        *args,\n",
+    "        padding=\"max_length\",\n",
+    "        max_length=min(tokenizer.model_max_length, MAX_LEN),\n",
+    "        truncation=True,\n",
+    "    )\n",
+    "    return result\n",
+    "\n",
     "\n",
     "tokenized_dataset = dataset_from_json.map(\n",
-    "    preprocess_fn,\n",
-    "    batched=True,\n",
-    "    desc=\"Running tokenizer on dataset\"\n",
+    "    preprocess_fn, batched=True, desc=\"Running tokenizer on dataset\"\n",
     ")"
    ]
   },
@@ -447,20 +465,22 @@
     "    save_total_limit=1,\n",
     "    per_device_train_batch_size=32,\n",
     "    per_device_eval_batch_size=32,\n",
-    "    fp16=True)\n",
+    "    fp16=True,\n",
+    ")\n",
     "\n",
     "trainer = Trainer(\n",
     "    model=model,\n",
     "    model_state_path=model_path,\n",
     "    recipe=recipe_path,\n",
     "    teacher=teacher,\n",
-    "    metadata_args=[\"per_device_train_batch_size\",\"per_device_eval_batch_size\",\"fp16\"],\n",
+    "    metadata_args=[\"per_device_train_batch_size\", \"per_device_eval_batch_size\", \"fp16\"],\n",
     "    args=training_args,\n",
     "    train_dataset=tokenized_dataset[\"train\"],\n",
     "    eval_dataset=tokenized_dataset[\"validation\"],\n",
     "    tokenizer=tokenizer,\n",
     "    data_collator=default_data_collator,\n",
-    "    compute_metrics=compute_metrics)"
+    "    compute_metrics=compute_metrics,\n",
+    ")"
    ]
   },
   {
 
@@ -72,10 +72,10 @@
     "import numpy as np\n",
     "from transformers import (\n",
     "    AutoModelForSequenceClassification,\n",
-    "    AutoConfig, \n",
-    "    AutoTokenizer, \n",
-    "    EvalPrediction, \n",
-    "    default_data_collator\n",
+    "    AutoConfig,\n",
+    "    AutoTokenizer,\n",
+    "    EvalPrediction,\n",
+    "    default_data_collator,\n",
     ")\n",
     "from datasets import load_dataset, load_metric"
    ]
@@ -129,10 +129,7 @@
     "dataset[\"train\"].to_csv(\"sst2-train.csv\")\n",
     "dataset[\"validation\"].to_csv(\"sst2-validation.csv\")\n",
     "\n",
-    "data_files = {\n",
-    "  \"train\": \"sst2-train.csv\",\n",
-    "  \"validation\": \"sst2-validation.csv\"\n",
-    "}\n",
+    "data_files = {\"train\": \"sst2-train.csv\", \"validation\": \"sst2-validation.csv\"}\n",
     "dataset = load_dataset(\"csv\", data_files=data_files)"
    ]
   },
@@ -193,13 +190,14 @@
    "source": [
     "metric = load_metric(\"glue\", \"sst2\")\n",
     "\n",
+    "\n",
     "def compute_metrics(p: EvalPrediction):\n",
-    "  preds = p.predictions[0] if isinstance(p.predictions, tuple) else p.predictions\n",
-    "  preds = np.argmax(preds, axis=1)\n",
-    "  result = metric.compute(predictions=preds, references=p.label_ids)\n",
-    "  if len(result) > 1:\n",
-    "      result[\"combined_score\"] = np.mean(list(result.values())).item()\n",
-    "  return result"
+    "    preds = p.predictions[0] if isinstance(p.predictions, tuple) else p.predictions\n",
+    "    preds = np.argmax(preds, axis=1)\n",
+    "    result = metric.compute(predictions=preds, references=p.label_ids)\n",
+    "    if len(result) > 1:\n",
+    "        result[\"combined_score\"] = np.mean(list(result.values())).item()\n",
+    "    return result"
    ]
   },
   {
@@ -249,10 +247,10 @@
    "outputs": [],
    "source": [
     "# downloads pruned-BERT model\n",
-    "model_stub = \"zoo:nlp/masked_language_modeling/obert-base/pytorch/huggingface/wikipedia_bookcorpus/pruned90-none\" \n",
+    "model_stub = \"zoo:nlp/masked_language_modeling/obert-base/pytorch/huggingface/wikipedia_bookcorpus/pruned90-none\"\n",
     "download_dir = \"./model\"\n",
     "zoo_model = Model(model_stub, download_path=download_dir)\n",
-    "model_path = zoo_model.training.path \n",
+    "model_path = zoo_model.training.path\n",
     "\n",
     "print(model_path)"
    ]
@@ -277,7 +275,9 @@
    "outputs": [],
    "source": [
     "# downloads transfer learning recipe\n",
-    "transfer_stub = \"zoo:nlp/sentiment_analysis/obert-base/pytorch/huggingface/sst2/pruned90_quant-none\"\n",
+    "transfer_stub = (\n",
+    "    \"zoo:nlp/sentiment_analysis/obert-base/pytorch/huggingface/sst2/pruned90_quant-none\"\n",
+    ")\n",
     "download_dir = \"./transfer_recipe\"\n",
     "zoo_model = Model(transfer_stub, download_path=download_dir)\n",
     "recipe_path = zoo_model.recipes.default.path\n",
@@ -305,10 +305,12 @@
    "outputs": [],
    "source": [
     "# downloads teacher\n",
-    "teacher_stub = \"zoo:nlp/sentiment_analysis/obert-base/pytorch/huggingface/sst2/base-none\"\n",
+    "teacher_stub = (\n",
+    "    \"zoo:nlp/sentiment_analysis/obert-base/pytorch/huggingface/sst2/base-none\"\n",
+    ")\n",
     "download_dir = \"./teacher\"\n",
     "zoo_model = Model(teacher_stub, download_path=download_dir)\n",
-    "teacher_path = zoo_model.training.path "
+    "teacher_path = zoo_model.training.path"
    ]
   },
   {
@@ -436,11 +438,19 @@
     "\n",
     "model_kwargs = {\"config\": model_config}\n",
     "model_kwargs[\"state_dict\"], s_delayed = SparseAutoModel._loadable_state_dict(model_path)\n",
-    "model = AutoModelForSequenceClassification.from_pretrained(model_path, **model_kwargs,)\n",
+    "model = AutoModelForSequenceClassification.from_pretrained(\n",
+    "    model_path,\n",
+    "    **model_kwargs,\n",
+    ")\n",
     "\n",
-    "teacher_kwargs = {'config':teacher_config}\n",
-    "teacher_kwargs[\"state_dict\"], t_delayed = SparseAutoModel._loadable_state_dict(teacher_path)\n",
-    "teacher = AutoModelForSequenceClassification.from_pretrained(teacher_path, **teacher_kwargs,)\n",
+    "teacher_kwargs = {\"config\": teacher_config}\n",
+    "teacher_kwargs[\"state_dict\"], t_delayed = SparseAutoModel._loadable_state_dict(\n",
+    "    teacher_path\n",
+    ")\n",
+    "teacher = AutoModelForSequenceClassification.from_pretrained(\n",
+    "    teacher_path,\n",
+    "    **teacher_kwargs,\n",
+    ")\n",
     "\n",
     "# optional - prints metrics about sparsity profiles of the models\n",
     "SparseAutoModel.log_model_load(model, model_path, \"student\", s_delayed)\n",
@@ -495,22 +505,25 @@
    "outputs": [],
    "source": [
     "MAX_LEN = 128\n",
+    "\n",
+    "\n",
     "def preprocess_fn(examples):\n",
-    "  args = None\n",
-    "  if INPUT_COL_2 is None:\n",
-    "    args = (examples[INPUT_COL_1], )\n",
-    "  else:\n",
-    "    args = (examples[INPUT_COL_1], examples[INPUT_COL_2])\n",
-    "  result = tokenizer(*args, \n",
-    "                   padding=\"max_length\", \n",
-    "                   max_length=min(tokenizer.model_max_length, MAX_LEN), \n",
-    "                   truncation=True)\n",
-    "  return result\n",
+    "    args = None\n",
+    "    if INPUT_COL_2 is None:\n",
+    "        args = (examples[INPUT_COL_1],)\n",
+    "    else:\n",
+    "        args = (examples[INPUT_COL_1], examples[INPUT_COL_2])\n",
+    "    result = tokenizer(\n",
+    "        *args,\n",
+    "        padding=\"max_length\",\n",
+    "        max_length=min(tokenizer.model_max_length, MAX_LEN),\n",
+    "        truncation=True,\n",
+    "    )\n",
+    "    return result\n",
+    "\n",
     "\n",
     "tokenized_dataset = dataset.map(\n",
-    "    preprocess_fn,\n",
-    "    batched=True,\n",
-    "    desc=\"Running tokenizer on dataset\"\n",
+    "    preprocess_fn, batched=True, desc=\"Running tokenizer on dataset\"\n",
     ")"
    ]
   },
@@ -549,20 +562,22 @@
     "    save_total_limit=1,\n",
     "    per_device_train_batch_size=32,\n",
     "    per_device_eval_batch_size=32,\n",
-    "    fp16=True)\n",
+    "    fp16=True,\n",
+    ")\n",
     "\n",
     "trainer = Trainer(\n",
     "    model=model,\n",
     "    model_state_path=model_path,\n",
     "    recipe=recipe_path,\n",
     "    teacher=teacher,\n",
-    "    metadata_args=[\"per_device_train_batch_size\",\"per_device_eval_batch_size\",\"fp16\"],\n",
+    "    metadata_args=[\"per_device_train_batch_size\", \"per_device_eval_batch_size\", \"fp16\"],\n",
     "    args=training_args,\n",
     "    train_dataset=tokenized_dataset[\"train\"],\n",
     "    eval_dataset=tokenized_dataset[\"validation\"],\n",
     "    tokenizer=tokenizer,\n",
     "    data_collator=default_data_collator,\n",
-    "    compute_metrics=compute_metrics)"
+    "    compute_metrics=compute_metrics,\n",
+    ")"
    ]
   },
   {