generation_script.py

import argparse
import os
from src.generation import *
from enum import Enum
import sys

MODELS = {
    "ST" : {"code_type" : ControlCodeType.SPECIAL_TOKEN, 
        "url":  "polito_aiml2021_textgen/uncategorized/gpt2-specialtoken:v1",
        "folder" : "./artifacts/gpt2-specialtoken-v1"},
    "SEP" : {"code_type": ControlCodeType.SEPARATOR, 
        "url":"polito_aiml2021_textgen/gpt2-separators/model-8p9purad:v0",
        "folder": "./artifacts/model-8p9purad-v0" },
    "ST-10F" : {"code_type" : ControlCodeType.SPECIAL_TOKEN, 
        "url":"polito_aiml2021_textgen/uncategorized/gpt2-specialtoken-10freezed:v0",
        "folder": "./artifacts/gpt2-specialtoken-10freezed-v0"},
    "SEP-10F" : {"code_type" : ControlCodeType.SEPARATOR, 
        "url":"polito_aiml2021_textgen/uncategorized/gpt2-TRUE_separators-10freezed:v0",
        "folder": "./artifacts/gpt2-TRUE_separators-10freezed-v0"},
    "D-ST" : {"code_type" : ControlCodeType.SPECIAL_TOKEN, 
        "url":"polito_aiml2021_textgen/distilgpt2-specialtoken/model-3b1lzdro:v0",
        "folder": "./artifacts/model-3b1lzdro-v0" },
    "T-ST": {"code_type": ControlCodeType.SPECIAL_TOKEN,
            "url": "polito_aiml2021_textgen/tiny_gpt2/tiny-gpt2:v0",
            "folder": "./artifacts/tiny-gpt2-v0"},
    "ST-0": {"code_type": ControlCodeType.SPECIAL_TOKEN,
            "url": "polito_aiml2021_textgen/gpt2-no-pretrain10/model-3kig3v2k:v0",
            "folder": "./artifacts/model-3kig3v2k-v0"}
}


parser = argparse.ArgumentParser()

parser.add_argument('--model', type=str, required=True, choices=list(MODELS.keys()),
                                        help='Model to use for generation')


parser.add_argument('--input', type=str, default="",
                        help= 'The start of the sequence(s) the model will generate')

parser.add_argument('--max_len', type=int, default=16,
                                        help='number of tokens to generate')

parser.add_argument('--temperature', type=float, default=0.9,
                                        help='temperature for sampling distribution; 0 means greedy')

parser.add_argument('--top_k', type=int, default=30,
                                        help='topk value for sampling from the softmax distribution ; 0 means no topk preferred')

parser.add_argument('--repetition_penalty', type=float, default=2.0,
                                        help='repetition penalty for greedy sampling')
parser.add_argument('--top_p', type=int, default=0.7,
                                        help='print top-n candidates during generations; defaults to 0 which is no printing')                                  

parser.add_argument('--control_codes', type=str, default="",
                                        help='Control codes to be used during generation separated by ", "' )

parser.add_argument('--num_returned_sequences',type=int,default=3,
                                        help='the number of sentences the model will generate' )

args = parser.parse_args()

model_name = args.model
model_obj = MODELS[model_name]
artifact_dir = model_obj['folder']

args.input = args.input.strip()

if not args.input or args.input == "<|startoftext|>":
    if args.model != "SEP" and args.model != "ST-0":
        print("Empty input is allowed only on SEP or ST-0 models.")
        sys.exit()
    else : 
        args.input = "<|startoftext|>"

if not os.path.isdir(artifact_dir):
    os.environ["WANDB_API_KEY"] = "92907f006616f5c5d84bf6f28f4ab8f6220b5ea1"
    import wandb
    run = wandb.init()
    artifact = run.use_artifact(model_obj["url"], type='model')
    artifact_dir = artifact.download()



from transformers import GPT2LMHeadModel, GPT2TokenizerFast

model = GPT2LMHeadModel.from_pretrained(artifact_dir)

if torch.cuda.is_available():
      model = model.cuda()

tokenizer = GPT2TokenizerFast.from_pretrained(artifact_dir)


generator = Generator(model,tokenizer)

control_codes = args.control_codes.split(", ")

generator.generate(control_codes, model_obj["code_type"], args.input, args.max_len,
                    args.num_returned_sequences, args.top_k, args.top_p, args.temperature, 
                    args.repetition_penalty )