#

dense-video-captioning

Here are 12 public repositories matching this topic...

gyxxyg / VTG-LLM

[Preprint] VTG-LLM: Integrating Timestamp Knowledge into Video LLMs for Enhanced Video Temporal Grounding

dense-video-captioning moment-retrieval video-highlight-detection multi-modal-large-language-model video-large-language-models

Updated Jul 22, 2024
Python

ttengwang / Awesome_Long_Form_Video_Understanding

Awesome papers & datasets specifically focused on long-term videos.

video-representation-learning video-dataset dense-video-captioning video-grounding temporal-action-detection temporal-action-localization temporal-sentence-grounding audio-visual-event-localization long-term-video video-large-language-models video-llms

Updated Jul 15, 2024

ailab-kyunghee / CM2_DVC

[CVPR 2024] Do you remember? Dense Video Captioning with Cross-Modal Memory Retrieval

video retrieval memory multi-modal dvc dense-video-captioning cross-modal-retrieval video-cap

Updated Jun 19, 2024
Python

ttengwang / PDVC

End-to-End Dense Video Captioning with Parallel Decoding (ICCV 2021)

dense-video-captioning youcook2 activitynet-captions video-paragraph-captioning

Updated Jan 3, 2024
Python

zjr2000 / GVL

Official implementation for paper Learning Grounded Vision-Language Representation for Versatile Understanding in Untrimmed Videos

pytorch representation-learning pytorch-implementation dense-video-captioning video-grounding video-language temporal-localization long-video-understanding

Updated Dec 8, 2023
Python

antoyang / VidChapters

[NeurIPS 2023 D&B] VidChapters-7M: Video Chapters at Scale

video-understanding weakly-supervised-learning video-captioning multimodal-learning vision-and-language dense-video-captioning pre-training temporal-language-grounding video-chapter-generation vid2seq

Updated Nov 13, 2023
Jupyter Notebook

josch14 / semantic-metadata-extraction-from-videos

Semantic Metadata Extraction from Generated Video Captions (CD-MAKE 2023).

framework video text entities relations dense-video-captioning semantic-metadata

Updated Oct 24, 2023
Python

v-iashin / MDVC

PyTorch implementation of Multi-modal Dense Video Captioning (CVPR 2020 Workshops)

audio visual speech pytorch transformer multi-modal i3d dense-video-captioning activitynet-captions cvpr-workshop

Updated Apr 8, 2023
Python

BMT

v-iashin / BMT

Source code for "Bi-modal Transformer for Dense Video Captioning" (BMVC 2020)

audio video pytorch transformer temporal-action-proposals i3d video-features dense-video-captioning multimodal-fusion activitynet-captions bmvc bmt bmvc20 bi-modal-transformer proposal-generator bi-modal-encoder

Updated Apr 8, 2023
Jupyter Notebook

ttengwang / dense-video-captioning-pytorch

Second-place solution to dense video captioning task in ActivityNet Challenge (CVPR 2020 workshop)

hierarchical-rnn dense-video-captioning activitynet-captions activitynet-challenge

Updated Aug 25, 2021
Python

LuoweiZhou / densecap

Dense video captioning in PyTorch

transformer video-captioning dense-video-captioning youcook2 activitynet-captions

Updated Aug 30, 2019
Jupyter Notebook

JaywongWang / DenseVideoCaptioning

Official Tensorflow Implementation of the paper "Bidirectional Attentive Fusion with Context Gating for Dense Video Captioning" in CVPR 2018, with code, model and prediction results.

dense-video-captioning

Updated Jul 8, 2019
Python

Improve this page

Add a description, image, and links to the dense-video-captioning topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the dense-video-captioning topic, visit your repo's landing page and select "manage topics."