DialogStudio/task-oriented-dialogues at main · salesforce/DialogStudio

History

Name		Name	Last commit message	Last commit date
parent directory ..
ABCD		ABCD
AirDialogue		AirDialogue
BiTOD		BiTOD
CaSiNo		CaSiNo
CraigslistBargains		CraigslistBargains
DSTC2-Clean		DSTC2-Clean
Disambiguation		Disambiguation
DuRecDial-2.0		DuRecDial-2.0
FRAMES		FRAMES
GECOR		GECOR
HDSA-Dialog		HDSA-Dialog
KETOD		KETOD
KVRET		KVRET
MS-DC		MS-DC
MULTIWOZ2_2		MULTIWOZ2_2
MetaLWOZ		MetaLWOZ
MuDoCo		MuDoCo
MulDoGO		MulDoGO
MultiWOZ_2.1		MultiWOZ_2.1
OpenDialKG		OpenDialKG
SGD		SGD
STAR		STAR
SalesBot		SalesBot
SimJointGEN		SimJointGEN
SimJointMovie		SimJointMovie
SimJointRestaurant		SimJointRestaurant
Taskmaster1		Taskmaster1
Taskmaster2		Taskmaster2
Taskmaster3		Taskmaster3
WOZ2_0		WOZ2_0
README.md		README.md

README.md

Task Oriented Dialogues

Below is a general format for task oriented dialogues:

{
    "dataset_name--train/val/test--dialog_id": {
        "original dialog id": str,
        "dialog index": int,
        "original dialog info": dict,
        "log": [
            {
                "turn id": int,
                "user utterance": str,
                "system response": str,
                "dialog history": str,
                "original user side information": dict,
                "original system side information": dict,
                "dst": str,
                "dst accumulated": str
            },
         	...
        ],
        "external knowledge non-flat": {
            "metadata": dict,
            "slots and values": dict
            "intents": dict,
            ...
        },
        "external knowledge": str,
        "intent knowledge": str,
        "prompt": [
            "This is a bot helping users to get navigation. Given the dialog context and external database, please generate a relevant system response for the user.",
            ...
        ]
    },
    ...
}

In general, datasets have the "external knowledge non-flat" and "external knowledge" in the whole dialogue level. There are also some datasets where every turn in "log" has own "external knowledge non-flat" and "external knowledge".

Here are datasets with turn-level "external knowledge":

'SimJointGEN', 'BiTOD', 'OpenDialKG', 'SimJointMovie', 'MS-DC', 'STAR', 'SimJointRestaurant', 'Taskmaster1', 'Taskmaster2', 'Taskmaster3'

And below is a general format for such datasets:

{
    "dataset_name--train/val/test--dialog_id": {
        "original dialog id": str,
        "dialog index": int,
        "original dialog info": dict,
        "log": [
            {
                "turn id": int,
                "user utterance": str,
                "system response": str,
                "dialog history": str,
                "original user side information": dict,
                "original system side information": dict,
                "dst": str,
                "dst accumulated": str
                "external knowledge non-flat": list,
                "external knowledge": str,
            },
         	...
        ]
        "prompt": [
            "This is a bot helping users to get navigation. Given the dialog context and external database, please generate a relevant system response for the user.",
            ...
        ]
    },
    ...
}

Please refer to each dataset folder for more details.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

task-oriented-dialogues

task-oriented-dialogues

README.md

Task Oriented Dialogues

Files

task-oriented-dialogues

Directory actions

More options

Directory actions

More options

Latest commit

History

task-oriented-dialogues

Folders and files

parent directory

README.md

Task Oriented Dialogues