Talk Keyword Index

TALK KEYWORD INDEX

This page contains an index consisting of author-provided keywords.

Shortcuts: -3 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

-
- Exposure bias	Progressive Retention Sampling for Sequence Generation-based Scene Text Spotting
- Sampling strategy	Progressive Retention Sampling for Sequence Generation-based Scene Text Spotting
- Scene text spotting	Progressive Retention Sampling for Sequence Generation-based Scene Text Spotting
- Sequence generation	Progressive Retention Sampling for Sequence Generation-based Scene Text Spotting
3
3D Reconstruction	A Simple Approach towards Frame Filtering for Efficient Gaussian Splatting
3d synthetic data	Impact of Style Transfer Approaches on Synthetic Data for Military Camouflaged Object Detection
A
Access Point selection	Power and Subcarrier Optimization for Heterogeneous QoS Requirement in Wireless Sensor Networks
Accuracy-speed trade-off	Benchmarking Real-Time Object Detection: Evaluating YOLO and RT-DETR on Speed, Accuracy, and Efficiency
Action recognition	KidRisk: Benchmark Dataset for Children Dangerous Action Recognition
Adam	Optimizing Credit Scoring Models for Decentralized Financial Applications
Adaptive adjustment	A method combining the reference information of the adaptive adjustment method and the decision maker of multi-objective evolutionary algorithms
Adhoc Video Retrieval	Event Retrieval from Large Video Collection in Ho Chi Minh City AI Challenge 2024
Adversarial attack	Adversarial Robustness of Medical Image Classifiers via Denoised Smoothing Diverse Adversarial Samples for Text-to-Image Generation via Quality-Diversity Optimization AYO-GAN: A novel GAN-based adversarial attack on YOLO object detection models
Adversarial Defense	Diffusion-Based Purification for Adversarial Defense in Medical Image Classification
Adversarial Robustness	Adversarial Robustness of Medical Image Classifiers via Denoised Smoothing
Aerial Images	Traffic Anomaly Detection under Extreme Weather from Aerial Images
Aerial scenario detection	EPC-YOLOv7: The Proposed One-stage Detector for Aerial Scenario Detection
Agent	"MAVEN: Video Retrieval System using A Multi-Agent Visual Exploration Network"
AI	Can Image Generative Models be Considered Experts?
AI-based Assistance	NewsInsight2.0: An Enhanced Version Integrating Large Language Model-based Query Optimization with Advanced Temporal Mechanisms
AI-Generated Image Recognition	AI-Generated Image Recognition via Fusion of CNNs and Vision Transformers
Alertness	A Low-Cost EEG-Based System for Measuring and Forecasting Levels of Alertness with Long Short-Term Memory
Anomaly detection	Log-based Representation Transferable Learning for Cross-System Anomaly Detection Traffic Anomaly Detection under Extreme Weather from Aerial Images
API Sequence	An Approach of Fine-Tuning Language Models and Handling Long Sequences for Efficiently API Call Analysis in Uncovering Windows Malware
Approximation Algorithm	Influence Maximization with Fairness Allocation Constraint
Archive System	A Proposed Large Language Model-Based Smart Search for Archive System
Art retrieval	MythraGen: Two-Stage Retrieval Augmented Art Generation Framework
Art synthesis	MythraGen: Two-Stage Retrieval Augmented Art Generation Framework
Artificial Intelligence of Things (AIoT)	Development of an Edge-Computing-Based Intelligent Service Framework for Smart Camera Applications
ASR (Automatic Speech Recognition)	LameFrames: Optimizing Video Event Retrieval Through Strategic Integration and Individual Strategy Enhancement
Attack detection method	A Novel Gradient-based Defense Method against Model Poisoning Attacks in Federated Learning
Attention mechanisms	DehazeCLNet: A Contrastive Learning Framework with Advanced Feature Extraction for Image Dehazing
Augmented Retrieval	LLM-Powered Video Search: A Comprehensive Multimedia Retrieval System
Authorization	Towards a Unified Delegated Authorization Framework for Microservice-based ERP Systems
AVL tree	A Tool for Preventing Consanguineous Marriages Using Vietnam's National Residents Database
B
B-splines	BSRBF-KAN: A combination of B-splines and Radial Basis Functions in Kolmogorov-Arnold Networks
Basal Metabolic Rate	Meal Plan App: Personalized meal plans based on personal unique needs.
Bee sound	Predicting Bee Swarming: Leveraging Machine Learning and Audio Feature Extraction
Behavioral facilitation	Analysis of Behavioral Facilitation Information During Typhoon Period Based on Victim Attributes
benchmark	Developing A Vietnamese Regional Voice Dataset and Benchmark For Region Recognition Based On Speech
Benchmarking	Motorcycle Helmet Detection Benchmarking
BERT	A Study On Explainable Graph Presentation Learning With Semantic Features Embedding For Windows Malware Detection
Bibliographic Network	Modeling Information Diffusion in Bibliographic Networks using Pretopology
BKcrawler	BKCrawler: A Scalable Web Data Extraction System Using Weak Supervision
BLIP	Decoding Deepfakes: Caption Guided Learning for Robust Deepfake Detection
BLIP2	MAVERICS: Multimodal Advanced Visual Event Retrieval with Integrated CPU-Optimized Search
Blockchain	Multi-Agent Chatbot for Efficient Interaction with Blockchain APIs
Boder k-Means	Border Fuzzy C-Means Clustering Algorithm
Body Mass Index	Meal Plan App: Personalized meal plans based on personal unique needs.
Brain Tumor Segmentation	MedGraph-RPE: Graph-Based Medical Segmentation Enhanced by Novel Relative Positioning Encoding
Bus travel time prediction	A Historical GPS Trajectory-Based Framework for Predicting Bus Travel Time
C
Camouflaged Object Detection	Impact of Style Transfer Approaches on Synthetic Data for Military Camouflaged Object Detection
cancer molecular biomarkers	Application of the SFE Feature Selection Method for Multi-Omic Biomarker Discovery in Brain Cancer Subtyping
Cardiac diagnostic	Cardio Care: A Vision Transformer Cardiac Classification based on Electrocardiogram Images and Signals
Category prediction	MEPC: Multi-level Product Category Recognition Image Dataset
Certificate Authority	Media Certificate Authority: A System to Ensure Media Content Originality for Daily Lifelog Media Collection
CES	Contour-enhanced Segmentation: A Novel Approach for Ambiguous Boundary in Polyp Segmentation
Chatbot	Multi-Agent Chatbot for Efficient Interaction with Blockchain APIs
chemical-drug relation extraction	Integrating Graph and Transformer-Based Models for Enhanced Chemical-Drug Relation Extraction in Document-Level Contexts
Chroma	Predicting Bee Swarming: Leveraging Machine Learning and Audio Feature Extraction
CLIP	ArtemisSearch: A Multimodal Search Engine for Efficient Video Log-Life Event Retrieval Using Time-Segmented Queries and Vision Transformer-based Feature Extraction "MAVEN: Video Retrieval System using A Multi-Agent Visual Exploration Network" Decoding Deepfakes: Caption Guided Learning for Robust Deepfake Detection
CLIP Model	LameFrames: Optimizing Video Event Retrieval Through Strategic Integration and Individual Strategy Enhancement
Cluster Management	Development of an Edge-Computing-Based Intelligent Service Framework for Smart Camera Applications
Clustering WSNs	A MAC Protocol for multi-cluster scheduling based on geographical segmentation and Precoloring Extension
CNN	Optimizing Winograd-based Convolution on GPUs AI-Generated Image Recognition via Fusion of CNNs and Vision Transformers
Colorectal Cancer	DOLG-CNet: Deep Orthogonal Fusion of Local and Global Features combined with Contrastive Learning and Deep Supervision for Polyp Segmentation
Complex Matrix factorization	Exemplar-Embed Complex Matrix Factorization with Elastic Net Penalty: An Advanced Approach for Data Representation
Complex Optimization	Exemplar-Embed Complex Matrix Factorization with Elastic Net Penalty: An Advanced Approach for Data Representation
Computer Vision	A Simple Approach towards Frame Filtering for Efficient Gaussian Splatting
Conditional Flow Matching	GCGE: GAN+CFM-powered Data Augmentation and GBT Ensemble Learning for Improving Diabetes Mellitus Prediction
Consanguineous marriage	A Tool for Preventing Consanguineous Marriages Using Vietnam's National Residents Database
Constraint Programming	Constraint Programming-Based Cutting Plane Algorithm for a Combination of Orienteering and Maximum Capture Problem
Containerization	Development of an Edge-Computing-Based Intelligent Service Framework for Smart Camera Applications
Content-based Retrieval	Real-Time Multi-User Multimedia Event Retrieval Application System Using WebSocket Protocol
Content-based Video Retrieval	Interactive Video Retrieval System for AI Challenge 2024 Using CLIP, RAM++, and LLM-Enhanced Tag Matching
Content-based video search	Enhancing Video Retrieval via Synergized Image Embeddings and RAG
Context extraction	SnapSeek: A Multimodal Video Retrieval System with Context Awareness for AI Challenge 2024
Context-based Retrieval	Fustar: Divide and Conquer Query in Video Retrieval System
Contextual Captioning	VisChronos: Revolutionizing Image Captioning Through Real-Life Events
Contextual Query Enrichment	RAPID: Retrieval-Augmented Parallel Inference Drafting for Text-Based Video Event Retrieval
contour	Contour-enhanced Segmentation: A Novel Approach for Ambiguous Boundary in Polyp Segmentation
Contrastive Learning	DOLG-CNet: Deep Orthogonal Fusion of Local and Global Features combined with Contrastive Learning and Deep Supervision for Polyp Segmentation Improving Vietnamese Legal Document Retrieval using Synthetic Data Contrastive Perturbation Enhancement for LLM-Based Machine Translation DehazeCLNet: A Contrastive Learning Framework with Advanced Feature Extraction for Image Dehazing
Convolution	Optimizing Winograd-based Convolution on GPUs
Convolution Neural Network	Unifying Convolution and Self-Attention for Liver Lesion Diagnosis on Multi-phase Magnetic Resonance Imaging
Convolutional Neural Network	A Deep Learning Approach to Early Identification of Remote Access Trojans
Convolutional Neural Network (CNN)	FDE-Net: Lightweight Depth Estimation for Monocular Cameras
Cosine Similarity	LameFrames: Optimizing Video Event Retrieval Through Strategic Integration and Individual Strategy Enhancement
Cost optimization	Cost Optimization in Competitive Facility Location under General Demand Model
Credit score	Optimizing Credit Scoring Models for Decentralized Financial Applications
cross-dataset
Cross-nested logit	Cost Optimization in Competitive Facility Location under General Demand Model
cryptography	OSA: FPGA-based Octa-core SPHINCS+ Accelerator for IoT Security Applications
CT Reconstruction	Dual-Domain Reconstruction Network for Enhancing Sparse-View and Low-Dose CT Imaging
CUDA	Optimizing Winograd-based Convolution on GPUs
Customer experiences	Exploring Vegan Dining Experiences: Insights from User-Generated Content Analysis
D
Da Nang	Forecasting Traffic Flow under Uncertainty: A Case Study in Da Nang
Dangerous action recognition	KidRisk: Benchmark Dataset for Children Dangerous Action Recognition
Data Augumentation	SeFed-IDS: A Collaborative Intrusion Detection System Utilizing Semi-Supervised Federated Learning and Data Augmentation
Data Enrichment	A Novel Simulation-Driven Data Enrichment Approach to Improve Machine Learning Algorithm Performance
data protection	Privacy Challenges in Genomic Data: A Scoping Review of Risks, Mitigation Strategies, and Research Gaps
Data Representation	Exemplar-Embed Complex Matrix Factorization with Elastic Net Penalty: An Advanced Approach for Data Representation
Data Synthesis	Improving Vietnamese Legal Document Retrieval using Synthetic Data
database security	Exploring Prompt Injection: Methodologies and Risks with an Interactive Chatbot Demonstration
dataset	Towards Real-Time Open World Instance Segmentation Developing A Vietnamese Regional Voice Dataset and Benchmark For Region Recognition Based On Speech
Dataset Augmentation	GCGE: GAN+CFM-powered Data Augmentation and GBT Ensemble Learning for Improving Diabetes Mellitus Prediction
DCT coefficient	A Novel Reversible Data Hiding for JPEG Images Based on Zero AC Coefficients Shifting
DD-ReconNet	Dual-Domain Reconstruction Network for Enhancing Sparse-View and Low-Dose CT Imaging
Decentralized Finance	Optimizing Credit Scoring Models for Decentralized Financial Applications
Deep clustering	Towards Unsupervised Speaker Diarization System for Multilingual Telephone Calls Using Pre-trained Whisper Model and Mixture of Sparse Autoencoders
deep compression	Hybrid Compression: Integrating Pruning and Quantization for Optimized Neural Networks
Deep Learning	Enhancing Image Authenticity in the Age of Generative AI: an Autoencoder-Driven Fourier Transform based Approach An Approach of Fine-Tuning Language Models and Handling Long Sequences for Efficiently API Call Analysis in Uncovering Windows Malware A Study On Explainable Graph Presentation Learning With Semantic Features Embedding For Windows Malware Detection Traffic Anomaly Detection under Extreme Weather from Aerial Images A Low-Cost EEG-Based System for Measuring and Forecasting Levels of Alertness with Long Short-Term Memory Leveraging Dynamic Graph Word Embedding for Efficient Contextual Representations Enhancing Software Fault Localization with Variational Autoencoder and Residual Neural Networks
deep neural network	Hybrid Compression: Integrating Pruning and Quantization for Optimized Neural Networks
deepfake
DeFi	A Reputation Scoring Framework for Lending Protocols using the PageRank Algorithm Optimizing Credit Scoring Models for Decentralized Financial Applications
Delegation	Towards a Unified Delegated Authorization Framework for Microservice-based ERP Systems
Denoised Smoothing	Adversarial Robustness of Medical Image Classifiers via Denoised Smoothing
Dependency parsing	Domain Generalization in Vietnamese Dependency Parsing: A Novel Benchmark and Domain Gap Analysis
Depth Estimation	FDE-Net: Lightweight Depth Estimation for Monocular Cameras
Depth supervision	SCA-DS: Face Anti-Spoofing Leveraging Enhanced Spatial and Channel-wise Attention and Depth Supervision
desktop workspace	Towards Enabling Tangible Interaction with Physical Objects in Virtual Reality Desktop Workplaces
DevOps	Development of an Edge-Computing-Based Intelligent Service Framework for Smart Camera Applications
Diabetes Prediction	GCGE: GAN+CFM-powered Data Augmentation and GBT Ensemble Learning for Improving Diabetes Mellitus Prediction
DIBR	Distortion-Resilient DIBR for Novel View Synthesis from a Single Image
Dietary assessment	Now I Know What I am Eating: Real-time Tracking and Nutritional Insights Using VietFood67 to Enhance User Experience
Diffusion	Diffusion-Based Purification for Adversarial Defense in Medical Image Classification
Diffusion Model	A Diffusion Model for Personalized Text-to-Image Generation
Direct Preference Optimization	Enhancing Neural Machine Translation with Direct Preference Optimization Using Human Feedback
Disaster	Analysis of Behavioral Facilitation Information During Typhoon Period Based on Victim Attributes
Distortion Handling	Distortion-Resilient DIBR for Novel View Synthesis from a Single Image
DMEA-II	A method combining the reference information of the adaptive adjustment method and the decision maker of multi-objective evolutionary algorithms
document-level contexts	Integrating Graph and Transformer-Based Models for Enhanced Chemical-Drug Relation Extraction in Document-Level Contexts
DOM	A User Privacy Risk - Driven Approach to Web Cookie Classification
Domain gap	Domain Generalization in Vietnamese Dependency Parsing: A Novel Benchmark and Domain Gap Analysis
Domain generalization	Domain Generalization in Vietnamese Dependency Parsing: A Novel Benchmark and Domain Gap Analysis
Dual-Scale Masked Multi-Head Self-Attention	MedCapNet: A Novel Approach to Medical Image Captioning
E
ECG classifier	Cardio Care: A Vision Transformer Cardiac Classification based on Electrocardiogram Images and Signals
Edge Computing	Development of an Edge-Computing-Based Intelligent Service Framework for Smart Camera Applications
Educational applications	ViEduQA: A New Vietnamese Dataset for Question Answer Generation in Education
EEG	A Low-Cost EEG-Based System for Measuring and Forecasting Levels of Alertness with Long Short-Term Memory
EfficientNet-B4	Knowledge Distillation for Lumbar Spine X-ray Classification
ElasticSearch	ReViMM: Enhanced Video Retrieval with Reweighting Mechanism for Multi-Modal Queries
Embedding	Media Certificate Authority: A System to Ensure Media Content Originality for Daily Lifelog Media Collection
embedding-based search	Transforming Video Search: Leveraging Multimodal Techniques and LLMs for Optimal Retrieval Enhanced Video Retrieval System: Leveraging GPT-4 for Multimodal Query Expansion and Open Image Search
Emotion recognition system	Real-Time Multi-Face Emotion Recognition for Enhancing Student Engagement in Classroom Environments Using Low-Power IoT Devices
Encryption	Exploring Prompt Injection: Methodologies and Risks with an Interactive Chatbot Demonstration
End-to-end retrieval system	Enhancing Video Retrieval via Synergized Image Embeddings and RAG
Endoscopy	A combination of YOLO and OSNet Re-ID neuronal networks for tracking abnormalities in Upper Gastrointestinal Endoscopy Videos
Energy control system	On the Effects of Training Objectives of Multi-agent Reinforcement Learning for Energy Consumption in Residential Buildings
Energy Efficiency	Optimizing Smart Grids with Reinforcement Learning for Enhanced Energy Efficiency
Energy Optimization	Optimizing Smart Grids with Reinforcement Learning for Enhanced Energy Efficiency
Energy-based model	TI-JEPA: An Innovative Energy-based Joint Embedding Strategy for Text-Image Multimodal Systems
Enhanced SCA	SCA-DS: Face Anti-Spoofing Leveraging Enhanced Spatial and Channel-wise Attention and Depth Supervision
Enhancement Encoder	MedCapNet: A Novel Approach to Medical Image Captioning
Ensemble Integration	Enhanced Video Event Retrieval through Adaptive Multi-Model Fusion with Large Language Models
ensemble learning
Enterprise information systems	Towards a Unified Delegated Authorization Framework for Microservice-based ERP Systems
epigenomic data	Privacy Challenges in Genomic Data: A Scoping Review of Risks, Mitigation Strategies, and Research Gaps
Evaluation Framework	Can Image Generative Models be Considered Experts?
Evaluation method	Towards Real-Time Open World Instance Segmentation
Event Extraction	VisChronos: Revolutionizing Image Captioning Through Real-Life Events
Event Retrieval	ArtemisSearch: A Multimodal Search Engine for Efficient Video Log-Life Event Retrieval Using Time-Segmented Queries and Vision Transformer-based Feature Extraction
Event-Based Image Captioning	VisChronos: Revolutionizing Image Captioning Through Real-Life Events
Event-based Retrieval	Enhanced Video Event Retrieval through Adaptive Multi-Model Fusion with Large Language Models
Evolutionary algorithms	A hybrid multifactorial evolutionary algorithm for the minimum s-Club cover problem
evolutionary computing	Application of the SFE Feature Selection Method for Multi-Omic Biomarker Discovery in Brain Cancer Subtyping
Evolutionary multitask optimization	A hybrid multifactorial evolutionary algorithm for the minimum s-Club cover problem
Expert System	Can Image Generative Models be Considered Experts?
Explainable Artificial Intelligence	A Study On Explainable Graph Presentation Learning With Semantic Features Embedding For Windows Malware Detection
Extreme Weather	Traffic Anomaly Detection under Extreme Weather from Aerial Images
F
Face anti-spoofing	SCA-DS: Face Anti-Spoofing Leveraging Enhanced Spatial and Channel-wise Attention and Depth Supervision
FaceID Adapter	A Diffusion Model for Personalized Text-to-Image Generation
Facility Location	Cost Optimization in Competitive Facility Location under General Demand Model
FAISS	LameFrames: Optimizing Video Event Retrieval Through Strategic Integration and Individual Strategy Enhancement ReViMM: Enhanced Video Retrieval with Reweighting Mechanism for Multi-Modal Queries
Farneback optical flow method	Flow Velocity Analysis of Rivers Using Farneback Optical Flow and STIV Techniques with Drone Data
Fault localization	Enhancing Software Fault Localization with Variational Autoencoder and Residual Neural Networks
feature extracting	Developing A Vietnamese Regional Voice Dataset and Benchmark For Region Recognition Based On Speech
Feature Extraction	Exemplar-Embed Complex Matrix Factorization with Elastic Net Penalty: An Advanced Approach for Data Representation DehazeCLNet: A Contrastive Learning Framework with Advanced Feature Extraction for Image Dehazing
Feature Pyramid Network (FPN)	EPC-YOLOv7: The Proposed One-stage Detector for Aerial Scenario Detection
feature selection	Application of the SFE Feature Selection Method for Multi-Omic Biomarker Discovery in Brain Cancer Subtyping
Federated learning	SeFed-IDS: A Collaborative Intrusion Detection System Utilizing Semi-Supervised Federated Learning and Data Augmentation A Novel Gradient-based Defense Method against Model Poisoning Attacks in Federated Learning
Few-shot Learning	A Study on Efficient Provenance-Based Intrusion Detection System using Few-shot Graph Representation Learning
Fine-tune Language Model	An Approach of Fine-Tuning Language Models and Handling Long Sequences for Efficiently API Call Analysis in Uncovering Windows Malware
Food object	Meal Plan App: Personalized meal plans based on personal unique needs. Now I Know What I am Eating: Real-time Tracking and Nutritional Insights Using VietFood67 to Enhance User Experience
Forecasting Traffic flow	Forecasting Traffic Flow under Uncertainty: A Case Study in Da Nang
Forest Diffusion	GCGE: GAN+CFM-powered Data Augmentation and GBT Ensemble Learning for Improving Diabetes Mellitus Prediction
Fourier transform	Improving Human Action Recognition Using Quaternion Discrete Fourier Transform in Transfer Learning
FPGA	OSA: FPGA-based Octa-core SPHINCS+ Accelerator for IoT Security Applications
FPS	Benchmarking Real-Time Object Detection: Evaluating YOLO and RT-DETR on Speed, Accuracy, and Efficiency
Fusion of CLIP and BEiT-3 for Retrieval Applications	A Hybrid Video Retrieval System Using CLIP and BEiT-3 for Enhanced Object and Contextual Understanding
Fuzzing	MADFuzz: A Study on Automatic Exploitation of Smart Contract Vulnerabilities Using Multi-Agent Reinforcement Learning-guided Fuzzing
Fuzzy c-Means	Border Fuzzy C-Means Clustering Algorithm
G
Gaussian RBFs	BSRBF-KAN: A combination of B-splines and Radial Basis Functions in Kolmogorov-Arnold Networks
GenAI	Evaluation of AI-Based Assistant Representations on User Interaction in Virtual Explorations
Generative AI	Enhancing Image Authenticity in the Age of Generative AI: an Autoencoder-Driven Fourier Transform based Approach A Proposed Large Language Model-Based Smart Search for Archive System A Diffusion Model for Personalized Text-to-Image Generation EPEdit: Redefining Image Editing with Generative AI and User-Centric Design AYO-GAN: A novel GAN-based adversarial attack on YOLO object detection models Can Image Generative Models be Considered Experts?
Genetic algorithm	Optimizing Credit Scoring Models for Decentralized Financial Applications
genomic privacy	Privacy Challenges in Genomic Data: A Scoping Review of Risks, Mitigation Strategies, and Research Gaps
genomic processing	Privacy Challenges in Genomic Data: A Scoping Review of Risks, Mitigation Strategies, and Research Gaps
Geopolitical map analysis	Advancing Geopolitical Map Analysis: An Intelligent System for Territorial Integrity Verification
GNN based optimization	Faster, Larger, Stronger: Optimally Solving Employee Scheduling Problems with Graph Neural Networks
GPS trajectory data	A Historical GPS Trajectory-Based Framework for Predicting Bus Travel Time
GPU	Optimizing Winograd-based Convolution on GPUs
Gradient Boosted Tree	GCGE: GAN+CFM-powered Data Augmentation and GBT Ensemble Learning for Improving Diabetes Mellitus Prediction
Graph	A Tool for Preventing Consanguineous Marriages Using Vietnam's National Residents Database
Graph Neural Networks	Leveraging Dynamic Graph Word Embedding for Efficient Contextual Representations
Graph Representation Learning	A Study on Efficient Provenance-Based Intrusion Detection System using Few-shot Graph Representation Learning
graph-based model	Integrating Graph and Transformer-Based Models for Enhanced Chemical-Drug Relation Extraction in Document-Level Contexts
GRU	A User Privacy Risk - Driven Approach to Web Cookie Classification
H
Handwriting Recognition	Post-Correction of Handwriting Recognition Using Large Language Models
Hash table	A Tool for Preventing Consanguineous Marriages Using Vietnam's National Residents Database
Hashing	Media Certificate Authority: A System to Ensure Media Content Originality for Daily Lifelog Media Collection
HCI	VOI-VR:Voice-driven Object Interaction in Virtual Reality with Large Language Models
Head-driven Phrase Structure Grammar	An Attempt to Develop a Neural Parser based on Simplified Head-Driven Phrase Structure Grammar on Vietnamese
Helmet	Motorcycle Helmet Detection Benchmarking
Heterogeneous Coverage of Target	H-LSHADE: An Efficient Hybrid Approach for Solving Heterogeneous Target Coverage in Visual Sensor Networks
Heterogeneous Network	Modeling Information Diffusion in Bibliographic Networks using Pretopology
Hierarchical image classification	MEPC: Multi-level Product Category Recognition Image Dataset
Ho Chi Minh AI City Challenge	KPI: Knowledge-based Processing for Interactive Video Retrieval
Human action recognition	Improving Human Action Recognition Using Quaternion Discrete Fourier Transform in Transfer Learning
Human pose estimation	DanceDuo: Bridging Human Movement and AI Choreography
Human-computer interaction	Budget-Aware Keyboardless Interaction DanceDuo: Bridging Human Movement and AI Choreography
Hybrid classroom	MRClassroom: A Mixed-Reality Interface for Improving Remote Students' Presence in Hybrid Classrooms
Hybrid method	VSum-HB: A Vietnamese Text Summarization Dataset For Reinforcement Learning From Human Feedback
Hybrid Objective Function	Dual-Domain Reconstruction Network for Enhancing Sparse-View and Low-Dose CT Imaging
I
Image	Can Image Generative Models be Considered Experts?
Image Analysis	Minimalist Preprocessing Approach for Image Synthesis Detection
Image Authenticity	Enhancing Image Authenticity in the Age of Generative AI: an Autoencoder-Driven Fourier Transform based Approach
Image Captioning	"MAVEN: Video Retrieval System using A Multi-Agent Visual Exploration Network"
Image dehazing	DehazeCLNet: A Contrastive Learning Framework with Advanced Feature Extraction for Image Dehazing
Image embedding	Enhancing Video Retrieval via Synergized Image Embeddings and RAG
Image Encoding	Media Certificate Authority: A System to Ensure Media Content Originality for Daily Lifelog Media Collection
Image Fingerprints	Enhancing Image Authenticity in the Age of Generative AI: an Autoencoder-Driven Fourier Transform based Approach
Image generation	A Stable Diffusion Pipeline for Diverse Procedural Painting via Text Prompts
Image Purification	Diffusion-Based Purification for Adversarial Defense in Medical Image Classification
Image Restoration	Boosting Image Super-Resolution: Incorporating Locally-enhanced FFN and Data Augmentation in the Swin Transformer architecture DehazeCLNet: A Contrastive Learning Framework with Advanced Feature Extraction for Image Dehazing
image retrieval	ReViMM: Enhanced Video Retrieval with Reweighting Mechanism for Multi-Modal Queries
image super-resolution	Boosting Image Super-Resolution: Incorporating Locally-enhanced FFN and Data Augmentation in the Swin Transformer architecture
Image Synthesis Detection	Minimalist Preprocessing Approach for Image Synthesis Detection
image to image translation	Impact of Style Transfer Approaches on Synthetic Data for Military Camouflaged Object Detection
image-based search	Enhanced Video Retrieval System: Leveraging GPT-4 for Multimodal Query Expansion and Open Image Search
Image-Text Multimodal Representation	Fustar: Divide and Conquer Query in Video Retrieval System
Incremental learning	Towards Real-Time Open World Instance Segmentation
Independent Cascade Model	Modeling Information Diffusion in Bibliographic Networks using Pretopology
Inflammation	Mouse Paw Inflammation Evaluation with Segment Anything and Lightness Classification
Information decay technique	A Historical GPS Trajectory-Based Framework for Predicting Bus Travel Time
Information Diffusion	Influence Maximization with Fairness Allocation Constraint Modeling Information Diffusion in Bibliographic Networks using Pretopology
Information Retrieval	Improving Vietnamese Legal Document Retrieval using Synthetic Data
Information Search And Retrieval	Interactive Video Retrieval System for AI Challenge 2024 Using CLIP, RAM++, and LLM-Enhanced Tag Matching
Information Security	Enhancing Image Authenticity in the Age of Generative AI: an Autoencoder-Driven Fourier Transform based Approach
Information System	An Optimized And Interactive Video Event Retrieval System With An Improved Temporal Algorithm
Instance segmentation	Towards Real-Time Open World Instance Segmentation
Intelligence Evaluation	Can Image Generative Models be Considered Experts?
Interactive	Exploring Prompt Injection: Methodologies and Risks with an Interactive Chatbot Demonstration A method combining the reference information of the adaptive adjustment method and the decision maker of multi-objective evolutionary algorithms
Interactive Question Answering	GeoSI: An Interesting Interactive System for Retrieving and Mapping News from Multiple Online Sources
Interactive Retrieval	VizQuest: Enhanced Video Event Retrieval Using Fusion and Temporal Modeling NewsInsight2.0: An Enhanced Version Integrating Large Language Model-based Query Optimization with Advanced Temporal Mechanisms Fustar: Divide and Conquer Query in Video Retrieval System An Optimized And Interactive Video Event Retrieval System With An Improved Temporal Algorithm
Interactive retrieval system	Unveiling Peripheral Information: A Context-Aware Video Retrieval Approach MMMSVR: An Advanced Video Retrieval and Question Answering System
interactive video retrieval	AViSearch: A Multimodal Video Event Retrieval System via Query Enhancement and Optimized Keyframes A Comprehensive Video Event Retrieval System for Vietnamese News: Integrating CLIP ViT, TASK-former, Transcripts, and OCR Real-Time Multi-User Multimedia Event Retrieval Application System Using WebSocket Protocol Transforming Video Search: Leveraging Multimodal Techniques and LLMs for Optimal Retrieval Interactive Video Retrieval System for AI Challenge 2024 Using CLIP, RAM++, and LLM-Enhanced Tag Matching Enhanced Video Retrieval System: Leveraging GPT-4 for Multimodal Query Expansion and Open Image Search
Interactive Video Retrieval System	KPI: Knowledge-based Processing for Interactive Video Retrieval
Interactive video search	Addressing Ambiguous Queries in Video Retrieval with Advanced Temporal Search
Interactivity	SnapSeek: A Multimodal Video Retrieval System with Context Awareness for AI Challenge 2024
Internet of Medical Things	An Efficient Explainable Unsupervised Machine Learning Approach for Network Intrusion Detection in IoMT
Intrusion Detection System	An Efficient Explainable Unsupervised Machine Learning Approach for Network Intrusion Detection in IoMT SeFed-IDS: A Collaborative Intrusion Detection System Utilizing Semi-Supervised Federated Learning and Data Augmentation
Iot device	Real-Time Multi-Face Emotion Recognition for Enhancing Student Engagement in Classroom Environments Using Low-Power IoT Devices
IoT security	OSA: FPGA-based Octa-core SPHINCS+ Accelerator for IoT Security Applications
IoT sensor networks	Power and Subcarrier Optimization for Heterogeneous QoS Requirement in Wireless Sensor Networks
Island omission detection	Advancing Geopolitical Map Analysis: An Intelligent System for Territorial Integrity Verification
J
Joint-Embedding Predictive Architecture	TI-JEPA: An Innovative Energy-based Joint Embedding Strategy for Text-Image Multimodal Systems
jpeg image	A Novel Reversible Data Hiding for JPEG Images Based on Zero AC Coefficients Shifting
K
Keystroke recognition	Budget-Aware Keyboardless Interaction
Knowledge Distillation	Knowledge Distillation for Lumbar Spine X-ray Classification Language-Guided Video Object Segmentation
Kolmogorov Arnold Networks	BSRBF-KAN: A combination of B-splines and Radial Basis Functions in Kolmogorov-Arnold Networks
L
Lagrange dual method	Power and Subcarrier Optimization for Heterogeneous QoS Requirement in Wireless Sensor Networks
Large data	Border Fuzzy C-Means Clustering Algorithm
Large Language Model	CoverNexus: Multi-Agent LLM System for Automated Code Coverage Enhancement Exploring Prompt Injection: Methodologies and Risks with an Interactive Chatbot Demonstration Multi-Agent Chatbot for Efficient Interaction with Blockchain APIs Contrastive Perturbation Enhancement for LLM-Based Machine Translation Interactive Video Retrieval System for AI Challenge 2024 Using CLIP, RAM++, and LLM-Enhanced Tag Matching Developing a Mobile Virtual Assistant using Large Language Models for Task Automation
Large Language Models	ViEduQA: A New Vietnamese Dataset for Question Answer Generation in Education Enhanced Video Retrieval System: Leveraging GPT-4 for Multimodal Query Expansion and Open Image Search
Large Language Models (LLM)	LLM-Powered Video Search: A Comprehensive Multimedia Retrieval System
Large Scaled Vector Database	CLIP-Enhanced Lifelog Retrieval System: Robust Multi-Modal Media Search with Real-Time Performance
Learning quality	Real-Time Multi-Face Emotion Recognition for Enhancing Student Engagement in Classroom Environments Using Low-Power IoT Devices
Lending	A Reputation Scoring Framework for Lending Protocols using the PageRank Algorithm Optimizing Credit Scoring Models for Decentralized Financial Applications
Lifelog	NewsInsight2.0: An Enhanced Version Integrating Large Language Model-based Query Optimization with Advanced Temporal Mechanisms
Lifelog Event Retrieval	Addressing Ambiguous Queries in Video Retrieval with Advanced Temporal Search
lifelog events	ReViMM: Enhanced Video Retrieval with Reweighting Mechanism for Multi-Modal Queries
Lightness classification	Mouse Paw Inflammation Evaluation with Segment Anything and Lightness Classification
Lightweight	Minimalist Preprocessing Approach for Image Synthesis Detection
Live Low Latency	An Evaluation of HTTP/3 and WebTransport over QUIC in Live Low Latency Video Streaming
Liver Lesion Classification	Unifying Convolution and Self-Attention for Liver Lesion Diagnosis on Multi-phase Magnetic Resonance Imaging
LLM	A Proposed Large Language Model-Based Smart Search for Archive System Post-Correction of Handwriting Recognition Using Large Language Models Multi-Agent Chatbot for Efficient Interaction with Blockchain APIs Evaluation of AI-Based Assistant Representations on User Interaction in Virtual Explorations
LLM-based Search	A Proposed Large Language Model-Based Smart Search for Archive System
LLM-Driven Query Optimization	A Hybrid Video Retrieval System Using CLIP and BEiT-3 for Enhanced Object and Contextual Understanding
LLMs	ReViMM: Enhanced Video Retrieval with Reweighting Mechanism for Multi-Modal Queries "MAVEN: Video Retrieval System using A Multi-Agent Visual Exploration Network"
LMPM model	Language-Guided Video Object Segmentation
Load Scheduling	Optimizing Smart Grids with Reinforcement Learning for Enhanced Energy Efficiency
Local Search	H-LSHADE: An Efficient Hybrid Approach for Solving Heterogeneous Target Coverage in Visual Sensor Networks
Log analysis	Log-based Representation Transferable Learning for Cross-System Anomaly Detection
Log representation	Log-based Representation Transferable Learning for Cross-System Anomaly Detection
Long Text Classification	ASC: Aggregating Sentence-level Classifications for Multi-label Long Text Classification
low-resource	Improving Quality of Vietnamese to Khmer Neural Machine Translation Using Multi-stage Fine-tuning Strategy
LSHADE Algorithm	H-LSHADE: An Efficient Hybrid Approach for Solving Heterogeneous Target Coverage in Visual Sensor Networks
LSTM	A Low-Cost EEG-Based System for Measuring and Forecasting Levels of Alertness with Long Short-Term Memory
Lumbar Spine	Knowledge Distillation for Lumbar Spine X-ray Classification
Lumbar Spondylosis	Knowledge Distillation for Lumbar Spine X-ray Classification
M
MAC Scheduling	A MAC Protocol for multi-cluster scheduling based on geographical segmentation and Precoloring Extension
Machine Learning	Predicting Bee Swarming: Leveraging Machine Learning and Audio Feature Extraction TL-SOINN: A Transfer Learning-Enhanced Self-Organizing Incremental Neural Network for Network Intrusion Detection A Simple Approach towards Frame Filtering for Efficient Gaussian Splatting Optimizing Smart Grids with Reinforcement Learning for Enhanced Energy Efficiency A Low-Cost EEG-Based System for Measuring and Forecasting Levels of Alertness with Long Short-Term Memory
machine translation	Contrastive Perturbation Enhancement for LLM-Based Machine Translation Improving Quality of Vietnamese to Khmer Neural Machine Translation Using Multi-stage Fine-tuning Strategy
Malware Detection	An Approach of Fine-Tuning Language Models and Handling Long Sequences for Efficiently API Call Analysis in Uncovering Windows Malware A Study On Explainable Graph Presentation Learning With Semantic Features Embedding For Windows Malware Detection
mAP	Benchmarking Real-Time Object Detection: Evaluating YOLO and RT-DETR on Speed, Accuracy, and Efficiency
Map-mapping	A Historical GPS Trajectory-Based Framework for Predicting Bus Travel Time
Maximum Capture Problem	Constraint Programming-Based Cutting Plane Algorithm for a Combination of Orienteering and Maximum Capture Problem
Meal Plan ·	Meal Plan App: Personalized meal plans based on personal unique needs.
MedCapNet	MedCapNet: A Novel Approach to Medical Image Captioning
MedGraph-RPE	MedGraph-RPE: Graph-Based Medical Segmentation Enhanced by Novel Relative Positioning Encoding
Media Retrieval	CLIP-Enhanced Lifelog Retrieval System: Robust Multi-Modal Media Search with Real-Time Performance
Medical Image Analysis Models	Adversarial Robustness of Medical Image Classifiers via Denoised Smoothing
Medical Image Captioning	MedCapNet: A Novel Approach to Medical Image Captioning
Meta Learning	A Study on Efficient Provenance-Based Intrusion Detection System using Few-shot Graph Representation Learning
MetaFormer	Contour-enhanced Segmentation: A Novel Approach for Ambiguous Boundary in Polyp Segmentation
MFCC	Predicting Bee Swarming: Leveraging Machine Learning and Audio Feature Extraction
Microservices	Development of an Edge-Computing-Based Intelligent Service Framework for Smart Camera Applications
Microservices architecture	Towards a Unified Delegated Authorization Framework for Microservice-based ERP Systems
Military camouflaged object detection	Impact of Style Transfer Approaches on Synthetic Data for Military Camouflaged Object Detection
Minimum S-club cover problem	A hybrid multifactorial evolutionary algorithm for the minimum s-Club cover problem
Minor-impact areas	Unveiling Peripheral Information: A Context-Aware Video Retrieval Approach
mixed reality	Towards Enabling Tangible Interaction with Physical Objects in Virtual Reality Desktop Workplaces MRClassroom: A Mixed-Reality Interface for Improving Remote Students' Presence in Hybrid Classrooms
Mixture of sparse autoencoders	Towards Unsupervised Speaker Diarization System for Multilingual Telephone Calls Using Pre-trained Whisper Model and Mixture of Sparse Autoencoders
MKLDNN optimizer	FDE-Net: Lightweight Depth Estimation for Monocular Cameras
Mobile Assistant	Developing a Mobile Virtual Assistant using Large Language Models for Task Automation
MobileNetV2	Knowledge Distillation for Lumbar Spine X-ray Classification
Model benchmarking	Benchmarking Real-Time Object Detection: Evaluating YOLO and RT-DETR on Speed, Accuracy, and Efficiency
Model poisoning attacks	A Novel Gradient-based Defense Method against Model Poisoning Attacks in Federated Learning
Model-Agnostic Meta-Learning	A Study on Efficient Provenance-Based Intrusion Detection System using Few-shot Graph Representation Learning
Modified Resnet	Enhancing Unsupervised Person Re-identification with Multi-View Image Representation
MOEA/D	A method combining the reference information of the adaptive adjustment method and the decision maker of multi-objective evolutionary algorithms
Monocular Images	FDE-Net: Lightweight Depth Estimation for Monocular Cameras
Motion Analysis	Motion Analysis in Static Images
Multi-Agent System	Multi-Agent Chatbot for Efficient Interaction with Blockchain APIs
Multi-agent systems	On the Effects of Training Objectives of Multi-agent Reinforcement Learning for Energy Consumption in Residential Buildings
Multi-Agents	CoverNexus: Multi-Agent LLM System for Automated Code Coverage Enhancement
Multi-label Classification	ASC: Aggregating Sentence-level Classifications for Multi-label Long Text Classification
Multi-level classification	MEPC: Multi-level Product Category Recognition Image Dataset
Multi-modal Retrieval System	A Hybrid Video Retrieval System Using CLIP and BEiT-3 for Enhanced Object and Contextual Understanding
Multi-modality Model	KPI: Knowledge-based Processing for Interactive Video Retrieval
Multi-objective evolutionary algorithm	A method combining the reference information of the adaptive adjustment method and the decision maker of multi-objective evolutionary algorithms
Multi-phase MRI	Unifying Convolution and Self-Attention for Liver Lesion Diagnosis on Multi-phase Magnetic Resonance Imaging
multi-stage fine-tuning	Improving Quality of Vietnamese to Khmer Neural Machine Translation Using Multi-stage Fine-tuning Strategy
Multi-task learning	A Lightweight End-to-End Multi-task Learning System for Vietnamese Speaker Verification
Multi-User	Real-Time Multi-User Multimedia Event Retrieval Application System Using WebSocket Protocol
multifactorial evolutionary algorithm	A hybrid multifactorial evolutionary algorithm for the minimum s-Club cover problem
Multilayer perceptron	Optimizing Credit Scoring Models for Decentralized Financial Applications
Multimedia and Multimodal Retrieval	RAPID: Retrieval-Augmented Parallel Inference Drafting for Text-Based Video Event Retrieval Enhancing Video Retrieval via Synergized Image Embeddings and RAG
Multimedia Information Retrieval	MMMSVR: An Advanced Video Retrieval and Question Answering System Enhanced Video Event Retrieval through Adaptive Multi-Model Fusion with Large Language Models
Multimedia retrieval	SnapSeek: A Multimodal Video Retrieval System with Context Awareness for AI Challenge 2024
Multimedia Search	LLM-Powered Video Search: A Comprehensive Multimedia Retrieval System
multimodal and multimedia retrieval	Transforming Video Search: Leveraging Multimodal Techniques and LLMs for Optimal Retrieval
multimodal and multimedia video retrieval	AViSearch: A Multimodal Video Event Retrieval System via Query Enhancement and Optimized Keyframes
Multimodal fusion	TI-JEPA: An Innovative Energy-based Joint Embedding Strategy for Text-Image Multimodal Systems
Multimodal Large Language Model	Developing a Mobile Virtual Assistant using Large Language Models for Task Automation
multimodal retrieval	MMMSVR: An Advanced Video Retrieval and Question Answering System A Comprehensive Video Event Retrieval System for Vietnamese News: Integrating CLIP ViT, TASK-former, Transcripts, and OCR Interactive Video Retrieval System for AI Challenge 2024 Using CLIP, RAM++, and LLM-Enhanced Tag Matching Enhanced Video Retrieval System: Leveraging GPT-4 for Multimodal Query Expansion and Open Image Search MAVERICS: Multimodal Advanced Visual Event Retrieval with Integrated CPU-Optimized Search
Multimodal retrieval system	Addressing Ambiguous Queries in Video Retrieval with Advanced Temporal Search
Music-driven dance generation	DanceDuo: Bridging Human Movement and AI Choreography
N
National News Visual	GeoSI: An Interesting Interactive System for Retrieving and Mapping News from Multiple Online Sources
National Residents Database	A Tool for Preventing Consanguineous Marriages Using Vietnam's National Residents Database
Natural language processing	Exploring Prompt Injection: Methodologies and Risks with an Interactive Chatbot Demonstration Leveraging Dynamic Graph Word Embedding for Efficient Contextual Representations
network intrusion detection system	TL-SOINN: A Transfer Learning-Enhanced Self-Organizing Incremental Neural Network for Network Intrusion Detection
network security	TL-SOINN: A Transfer Learning-Enhanced Self-Organizing Incremental Neural Network for Network Intrusion Detection
Neural Machine Translation	Enhancing Neural Machine Translation with Direct Preference Optimization Using Human Feedback
Neural painting	A Stable Diffusion Pipeline for Diverse Procedural Painting via Text Prompts
Neural Parser	An Attempt to Develop a Neural Parser based on Simplified Head-Driven Phrase Structure Grammar on Vietnamese
NLP	VOI-VR:Voice-driven Object Interaction in Virtual Reality with Large Language Models
Non-IID	SeFed-IDS: A Collaborative Intrusion Detection System Utilizing Semi-Supervised Federated Learning and Data Augmentation
Novel View Synthesis	Distortion-Resilient DIBR for Novel View Synthesis from a Single Image
Nutritional Labels	Meal Plan App: Personalized meal plans based on personal unique needs.
O
Object Detection	Motorcycle Helmet Detection Benchmarking Enhanced Video Event Retrieval through Adaptive Multi-Model Fusion with Large Language Models Distribution-Guided Object Counting with Optimal Transport and DINO-Based density Refinement
Object detection model	AYO-GAN: A novel GAN-based adversarial attack on YOLO object detection models
OCR (Optical Character Recognition)	LameFrames: Optimizing Video Event Retrieval Through Strategic Integration and Individual Strategy Enhancement
Open world	Towards Real-Time Open World Instance Segmentation
Optical Character Recognition	Enhanced Video Event Retrieval through Adaptive Multi-Model Fusion with Large Language Models
Optical Illusion	Motion Analysis in Static Images
optimal solution	Faster, Larger, Stronger: Optimally Solving Employee Scheduling Problems with Graph Neural Networks
Orienteering Problem	Constraint Programming-Based Cutting Plane Algorithm for a Combination of Orienteering and Maximum Capture Problem
OSNet	A combination of YOLO and OSNet Re-ID neuronal networks for tracking abnormalities in Upper Gastrointestinal Endoscopy Videos
Out-of-domain problem	Domain Generalization in Vietnamese Dependency Parsing: A Novel Benchmark and Domain Gap Analysis
Outer Approximation	Constraint Programming-Based Cutting Plane Algorithm for a Combination of Orienteering and Maximum Capture Problem
Outer-Approximation	Cost Optimization in Competitive Facility Location under General Demand Model
P
PageRank	A Reputation Scoring Framework for Lending Protocols using the PageRank Algorithm
Parallel Computing	Optimizing Winograd-based Convolution on GPUs
Parallel Inference	RAPID: Retrieval-Augmented Parallel Inference Drafting for Text-Based Video Event Retrieval
Partial Convolution	EPC-YOLOv7: The Proposed One-stage Detector for Aerial Scenario Detection
particle swarm optimization	Application of the SFE Feature Selection Method for Multi-Omic Biomarker Discovery in Brain Cancer Subtyping
Pascal VOC	Benchmarking Real-Time Object Detection: Evaluating YOLO and RT-DETR on Speed, Accuracy, and Efficiency
Person Re-Identification	Enhancing Unsupervised Person Re-identification with Multi-View Image Representation
Photo Editor Tool	EPEdit: Redefining Image Editing with Generative AI and User-Centric Design
Piecewise linear approximation	Cost Optimization in Competitive Facility Location under General Demand Model
Place Recognition	Enhanced Video Event Retrieval through Adaptive Multi-Model Fusion with Large Language Models
polyp segmentation	DOLG-CNet: Deep Orthogonal Fusion of Local and Global Features combined with Contrastive Learning and Deep Supervision for Polyp Segmentation Contour-enhanced Segmentation: A Novel Approach for Ambiguous Boundary in Polyp Segmentation
Post-Correction	Post-Correction of Handwriting Recognition Using Large Language Models
Post-Quantum Cryptography	OSA: FPGA-based Octa-core SPHINCS+ Accelerator for IoT Security Applications
Power allocation	Power and Subcarrier Optimization for Heterogeneous QoS Requirement in Wireless Sensor Networks
PP-OCRv3	MAVERICS: Multimodal Advanced Visual Event Retrieval with Integrated CPU-Optimized Search
Pre-trained Language Models	ViEduQA: A New Vietnamese Dataset for Question Answer Generation in Education
Prediction Aggregation	ASC: Aggregating Sentence-level Classifications for Multi-label Long Text Classification
Presence	MRClassroom: A Mixed-Reality Interface for Improving Remote Students' Presence in Hybrid Classrooms
Pretopology	Modeling Information Diffusion in Bibliographic Networks using Pretopology
Procedural painting	A Stable Diffusion Pipeline for Diverse Procedural Painting via Text Prompts
Product category prediction	MEPC: Multi-level Product Category Recognition Image Dataset
prompt engineering	Enhanced Video Retrieval System: Leveraging GPT-4 for Multimodal Query Expansion and Open Image Search
Prompt injection	Exploring Prompt Injection: Methodologies and Risks with an Interactive Chatbot Demonstration
Prompt-based object counting	Distribution-Guided Object Counting with Optimal Transport and DINO-Based density Refinement
Provenance Data	A Study on Efficient Provenance-Based Intrusion Detection System using Few-shot Graph Representation Learning
pruning	Hybrid Compression: Integrating Pruning and Quantization for Optimized Neural Networks
Q
Quality-diversity optimization	A Stable Diffusion Pipeline for Diverse Procedural Painting via Text Prompts Diverse Adversarial Samples for Text-to-Image Generation via Quality-Diversity Optimization
quantization	A Novel Reversible Data Hiding for JPEG Images Based on Zero AC Coefficients Shifting Hybrid Compression: Integrating Pruning and Quantization for Optimized Neural Networks
Quaternions	Improving Human Action Recognition Using Quaternion Discrete Fourier Transform in Transfer Learning
Query Context	ArtemisSearch: A Multimodal Search Engine for Efficient Video Log-Life Event Retrieval Using Time-Segmented Queries and Vision Transformer-based Feature Extraction
Question Answer Generation	ViEduQA: A New Vietnamese Dataset for Question Answer Generation in Education
Question-Answering Systems	URAG: Implementing a Unified Hybrid RAG for Precise Answers in University Admission Chatbots - A Case Study at HCMUT
QUIC	An Evaluation of HTTP/3 and WebTransport over QUIC in Live Low Latency Video Streaming
R
Radial Basis Functions	BSRBF-KAN: A combination of B-splines and Radial Basis Functions in Kolmogorov-Arnold Networks
RAG	A Proposed Large Language Model-Based Smart Search for Archive System
Rainy Weather	Traffic Anomaly Detection under Extreme Weather from Aerial Images
Rank Fusion	VizQuest: Enhanced Video Event Retrieval Using Fusion and Temporal Modeling
RAT Detection	A Deep Learning Approach to Early Identification of Remote Access Trojans
Re-ID	A combination of YOLO and OSNet Re-ID neuronal networks for tracking abnormalities in Upper Gastrointestinal Endoscopy Videos
Re-ranking	Enhanced Video Event Retrieval through Adaptive Multi-Model Fusion with Large Language Models
Real-time food detection	Now I Know What I am Eating: Real-time Tracking and Nutritional Insights Using VietFood67 to Enhance User Experience
Real-time News Retrieval	GeoSI: An Interesting Interactive System for Retrieving and Mapping News from Multiple Online Sources
Real-time object detection	Benchmarking Real-Time Object Detection: Evaluating YOLO and RT-DETR on Speed, Accuracy, and Efficiency
Real-time system	Real-Time Multi-Face Emotion Recognition for Enhancing Student Engagement in Classroom Environments Using Low-Power IoT Devices A Low-Cost EEG-Based System for Measuring and Forecasting Levels of Alertness with Long Short-Term Memory
Real-World Semantics	VisChronos: Revolutionizing Image Captioning Through Real-Life Events
Recognition ·	Meal Plan App: Personalized meal plans based on personal unique needs.
Recursive Feature Elimination	An Efficient Explainable Unsupervised Machine Learning Approach for Network Intrusion Detection in IoMT
Reference point	A method combining the reference information of the adaptive adjustment method and the decision maker of multi-objective evolutionary algorithms
Referring Video Object Segmentation	Language-Guided Video Object Segmentation
Reinforcement learning	MADFuzz: A Study on Automatic Exploitation of Smart Contract Vulnerabilities Using Multi-Agent Reinforcement Learning-guided Fuzzing Optimizing Smart Grids with Reinforcement Learning for Enhanced Energy Efficiency On the Effects of Training Objectives of Multi-agent Reinforcement Learning for Energy Consumption in Residential Buildings
Relative Positional Encoder	MedGraph-RPE: Graph-Based Medical Segmentation Enhanced by Novel Relative Positioning Encoding
Remote Access Trojan	A Deep Learning Approach to Early Identification of Remote Access Trojans
Remote collaboration	MRClassroom: A Mixed-Reality Interface for Improving Remote Students' Presence in Hybrid Classrooms
Reputation Score	A Reputation Scoring Framework for Lending Protocols using the PageRank Algorithm
Residual Noise	Enhancing Image Authenticity in the Age of Generative AI: an Autoencoder-Driven Fourier Transform based Approach
ResNet	Enhancing Software Fault Localization with Variational Autoencoder and Residual Neural Networks
Retrieval	A Proposed Large Language Model-Based Smart Search for Archive System
Retrieval Augmented Generation	Enhancing Retrieval Augmented Generation with Hierarchical Text Segmentation Chunking
Retrieval System	Fustar: Divide and Conquer Query in Video Retrieval System
Retrieval-Augmented Generation	URAG: Implementing a Unified Hybrid RAG for Precise Answers in University Admission Chatbots - A Case Study at HCMUT LLM-Powered Video Search: A Comprehensive Multimedia Retrieval System
Retrieval-augmented generation (RAG)	Enhancing Video Retrieval via Synergized Image Embeddings and RAG
reversible data hiding	A Novel Reversible Data Hiding for JPEG Images Based on Zero AC Coefficients Shifting
reweighting	ReViMM: Enhanced Video Retrieval with Reweighting Mechanism for Multi-Modal Queries
Risk Levels	A User Privacy Risk - Driven Approach to Web Cookie Classification
Risk Patterns	A User Privacy Risk - Driven Approach to Web Cookie Classification
RLHF	Enhancing Neural Machine Translation with Direct Preference Optimization Using Human Feedback VSum-HB: A Vietnamese Text Summarization Dataset For Reinforcement Learning From Human Feedback
Robot Operating System (ROS)	A Novel Simulation-Driven Data Enrichment Approach to Improve Machine Learning Algorithm Performance
Robust deepfake detection	Decoding Deepfakes: Caption Guided Learning for Robust Deepfake Detection
Robustness	Motorcycle Helmet Detection Benchmarking
RT-DETR	Benchmarking Real-Time Object Detection: Evaluating YOLO and RT-DETR on Speed, Accuracy, and Efficiency
S
scheduling	Faster, Larger, Stronger: Optimally Solving Employee Scheduling Problems with Graph Neural Networks
search engine	ArtemisSearch: A Multimodal Search Engine for Efficient Video Log-Life Event Retrieval Using Time-Segmented Queries and Vision Transformer-based Feature Extraction ReViMM: Enhanced Video Retrieval with Reweighting Mechanism for Multi-Modal Queries
Self-Attention	Unifying Convolution and Self-Attention for Liver Lesion Diagnosis on Multi-phase Magnetic Resonance Imaging
Self-supervised Learning	Improving Vietnamese Legal Document Retrieval using Synthetic Data
Semantic Chunking	Enhancing Retrieval Augmented Generation with Hierarchical Text Segmentation Chunking
Semantic Search	LLM-Powered Video Search: A Comprehensive Multimedia Retrieval System
Semantic segmentation	Mouse Paw Inflammation Evaluation with Segment Anything and Lightness Classification
Semi-Automation	Media Certificate Authority: A System to Ensure Media Content Originality for Daily Lifelog Media Collection
Semi-supervised	Border Fuzzy C-Means Clustering Algorithm
Semi-Supervised Learning	SeFed-IDS: A Collaborative Intrusion Detection System Utilizing Semi-Supervised Federated Learning and Data Augmentation
Sentence-level Classification	ASC: Aggregating Sentence-level Classifications for Multi-label Long Text Classification
Sentiment analysis	Exploring Vegan Dining Experiences: Insights from User-Generated Content Analysis
Simulated annealing algorithm	A hybrid multifactorial evolutionary algorithm for the minimum s-Club cover problem
sketch-based image retrieval	A Comprehensive Video Event Retrieval System for Vietnamese News: Integrating CLIP ViT, TASK-former, Transcripts, and OCR
Sketch-based retrieval	SnapSeek: A Multimodal Video Retrieval System with Context Awareness for AI Challenge 2024
Skin lesion Segmentation	MedGraph-RPE: Graph-Based Medical Segmentation Enhanced by Novel Relative Positioning Encoding
Smart contract	MADFuzz: A Study on Automatic Exploitation of Smart Contract Vulnerabilities Using Multi-Agent Reinforcement Learning-guided Fuzzing
Smart Grid	Optimizing Smart Grids with Reinforcement Learning for Enhanced Energy Efficiency
Snowy Weather	Traffic Anomaly Detection under Extreme Weather from Aerial Images
SNS	Analysis of Behavioral Facilitation Information During Typhoon Period Based on Victim Attributes
Social Network	Influence Maximization with Fairness Allocation Constraint
Software Architecture	GeoSI: An Interesting Interactive System for Retrieving and Mapping News from Multiple Online Sources
Software Testing	CoverNexus: Multi-Agent LLM System for Automated Code Coverage Enhancement
Space-Time Image Velocimetry (STIV)	Flow Velocity Analysis of Rivers Using Farneback Optical Flow and STIV Techniques with Drone Data
Spatial Insights	NewsInsight2.0: An Enhanced Version Integrating Large Language Model-based Query Optimization with Advanced Temporal Mechanisms
Spatial/channel-wise attention	SCA-DS: Face Anti-Spoofing Leveraging Enhanced Spatial and Channel-wise Attention and Depth Supervision
Speaker verification	A Lightweight End-to-End Multi-task Learning System for Vietnamese Speaker Verification
speech classification	Developing A Vietnamese Regional Voice Dataset and Benchmark For Region Recognition Based On Speech
SPHINCS+	OSA: FPGA-based Octa-core SPHINCS+ Accelerator for IoT Security Applications
Stable diffusion	A Stable Diffusion Pipeline for Diverse Procedural Painting via Text Prompts EPEdit: Redefining Image Editing with Generative AI and User-Centric Design
Stacking Ensemble Learning	GCGE: GAN+CFM-powered Data Augmentation and GBT Ensemble Learning for Improving Diabetes Mellitus Prediction
Static Images	Motion Analysis in Static Images
STFT	Predicting Bee Swarming: Leveraging Machine Learning and Audio Feature Extraction
Stochastic gradient descent	Optimizing Credit Scoring Models for Decentralized Financial Applications
StrongSORT	A combination of YOLO and OSNet Re-ID neuronal networks for tracking abnormalities in Upper Gastrointestinal Endoscopy Videos
style transfer	Impact of Style Transfer Approaches on Synthetic Data for Military Camouflaged Object Detection
Submodular Cuts	Constraint Programming-Based Cutting Plane Algorithm for a Combination of Orienteering and Maximum Capture Problem
Swarming behavior	Predicting Bee Swarming: Leveraging Machine Learning and Audio Feature Extraction
swin transformer	Boosting Image Super-Resolution: Incorporating Locally-enhanced FFN and Data Augmentation in the Swin Transformer architecture
Synthetic Image Detection	Enhancing Image Authenticity in the Age of Generative AI: an Autoencoder-Driven Fourier Transform based Approach
T
tangible interaction	Towards Enabling Tangible Interaction with Physical Objects in Virtual Reality Desktop Workplaces
Telephone call	Towards Unsupervised Speaker Diarization System for Multilingual Telephone Calls Using Pre-trained Whisper Model and Mixture of Sparse Autoencoders
Temporal Retrieval	VizQuest: Enhanced Video Event Retrieval Using Fusion and Temporal Modeling An Optimized And Interactive Video Event Retrieval System With An Improved Temporal Algorithm
Temporal Search	ArtemisSearch: A Multimodal Search Engine for Efficient Video Log-Life Event Retrieval Using Time-Segmented Queries and Vision Transformer-based Feature Extraction CLIP-Enhanced Lifelog Retrieval System: Robust Multi-Modal Media Search with Real-Time Performance MAVERICS: Multimodal Advanced Visual Event Retrieval with Integrated CPU-Optimized Search
Temporal-Aware Search Mechanisms	A Hybrid Video Retrieval System Using CLIP and BEiT-3 for Enhanced Object and Contextual Understanding
Teritorial Integrity Verification	Advancing Geopolitical Map Analysis: An Intelligent System for Territorial Integrity Verification
Text Classification	Leveraging Dynamic Graph Word Embedding for Efficient Contextual Representations
Text Embedding	Event Retrieval from Large Video Collection in Ho Chi Minh City AI Challenge 2024
Text Segmentation	Enhancing Retrieval Augmented Generation with Hierarchical Text Segmentation Chunking
Text Summarization	VSum-HB: A Vietnamese Text Summarization Dataset For Reinforcement Learning From Human Feedback
Text to Image	A Diffusion Model for Personalized Text-to-Image Generation
text-based image retrieval	AViSearch: A Multimodal Video Event Retrieval System via Query Enhancement and Optimized Keyframes MMMSVR: An Advanced Video Retrieval and Question Answering System A Comprehensive Video Event Retrieval System for Vietnamese News: Integrating CLIP ViT, TASK-former, Transcripts, and OCR Transforming Video Search: Leveraging Multimodal Techniques and LLMs for Optimal Retrieval
Text-Based Query	LameFrames: Optimizing Video Event Retrieval Through Strategic Integration and Individual Strategy Enhancement
text-based search	LLM-Powered Video Search: A Comprehensive Multimedia Retrieval System Enhanced Video Retrieval System: Leveraging GPT-4 for Multimodal Query Expansion and Open Image Search
Text-Based Video Event Retrieval	RAPID: Retrieval-Augmented Parallel Inference Drafting for Text-Based Video Event Retrieval
Text-to-image generation	Diverse Adversarial Samples for Text-to-Image Generation via Quality-Diversity Optimization MythraGen: Two-Stage Retrieval Augmented Art Generation Framework
Text-to-Image Matching	CESE: A Clip-based Event Search Engine for AI Challenge HCMC 2024
Topic modeling	Exploring Vegan Dining Experiences: Insights from User-Generated Content Analysis
Tracking	A combination of YOLO and OSNet Re-ID neuronal networks for tracking abnormalities in Upper Gastrointestinal Endoscopy Videos
Traffic flow prediction	Forecasting Traffic Flow under Uncertainty: A Case Study in Da Nang
Traffic Surveillance	Traffic Anomaly Detection under Extreme Weather from Aerial Images
Trajectory similarity	A Historical GPS Trajectory-Based Framework for Predicting Bus Travel Time
Transfer learning	TL-SOINN: A Transfer Learning-Enhanced Self-Organizing Incremental Neural Network for Network Intrusion Detection Log-based Representation Transferable Learning for Cross-System Anomaly Detection Improving Human Action Recognition Using Quaternion Discrete Fourier Transform in Transfer Learning
Transformer	An Attempt to Develop a Neural Parser based on Simplified Head-Driven Phrase Structure Grammar on Vietnamese Unifying Convolution and Self-Attention for Liver Lesion Diagnosis on Multi-phase Magnetic Resonance Imaging
transformer-based model	Integrating Graph and Transformer-Based Models for Enhanced Chemical-Drug Relation Extraction in Document-Level Contexts
U
UAV Simulation	A Novel Simulation-Driven Data Enrichment Approach to Improve Machine Learning Algorithm Performance
UCF50 dataset	Improving Human Action Recognition Using Quaternion Discrete Fourier Transform in Transfer Learning
Uncertainty in traffic	Forecasting Traffic Flow under Uncertainty: A Case Study in Da Nang
University Admission Chatbots	URAG: Implementing a Unified Hybrid RAG for Precise Answers in University Admission Chatbots - A Case Study at HCMUT
Unsupervised Domain Adaptation	Enhancing Unsupervised Person Re-identification with Multi-View Image Representation
Unsupervised Learning	Enhancing Unsupervised Person Re-identification with Multi-View Image Representation
Unsupervised Machine Learning	An Efficient Explainable Unsupervised Machine Learning Approach for Network Intrusion Detection in IoMT
Unsupervised speaker diarization	Towards Unsupervised Speaker Diarization System for Multilingual Telephone Calls Using Pre-trained Whisper Model and Mixture of Sparse Autoencoders
Upper Gastrointestinal	A combination of YOLO and OSNet Re-ID neuronal networks for tracking abnormalities in Upper Gastrointestinal Endoscopy Videos
Upstream Rivers	Flow Velocity Analysis of Rivers Using Farneback Optical Flow and STIV Techniques with Drone Data
Usearch	MAVERICS: Multimodal Advanced Visual Event Retrieval with Integrated CPU-Optimized Search
User generated content	Exploring Vegan Dining Experiences: Insights from User-Generated Content Analysis
User Interaction	Event Retrieval from Large Video Collection in Ho Chi Minh City AI Challenge 2024
User Privacy	A User Privacy Risk - Driven Approach to Web Cookie Classification
V
Variational autoencoder	Enhancing Software Fault Localization with Variational Autoencoder and Residual Neural Networks
Vector	Media Certificate Authority: A System to Ensure Media Content Originality for Daily Lifelog Media Collection
Vegan restaurants	Exploring Vegan Dining Experiences: Insights from User-Generated Content Analysis
Victim	Analysis of Behavioral Facilitation Information During Typhoon Period Based on Victim Attributes
Video Browsing	Real-Time Multi-User Multimedia Event Retrieval Application System Using WebSocket Protocol
Video Event Retrieval	CESE: A Clip-based Event Search Engine for AI Challenge HCMC 2024 VizQuest: Enhanced Video Event Retrieval Using Fusion and Temporal Modeling A Hybrid Video Retrieval System Using CLIP and BEiT-3 for Enhanced Object and Contextual Understanding NewsInsight2.0: An Enhanced Version Integrating Large Language Model-based Query Optimization with Advanced Temporal Mechanisms An Optimized And Interactive Video Event Retrieval System With An Improved Temporal Algorithm LameFrames: Optimizing Video Event Retrieval Through Strategic Integration and Individual Strategy Enhancement ReViMM: Enhanced Video Retrieval with Reweighting Mechanism for Multi-Modal Queries
Video Retrieval	Unveiling Peripheral Information: A Context-Aware Video Retrieval Approach A Comprehensive Video Event Retrieval System for Vietnamese News: Integrating CLIP ViT, TASK-former, Transcripts, and OCR Enhancing Video Retrieval via Synergized Image Embeddings and RAG LLM-Powered Video Search: A Comprehensive Multimedia Retrieval System "MAVEN: Video Retrieval System using A Multi-Agent Visual Exploration Network"
Video Search	Interactive Video Retrieval System for AI Challenge 2024 Using CLIP, RAM++, and LLM-Enhanced Tag Matching
Video Streaming	An Evaluation of HTTP/3 and WebTransport over QUIC in Live Low Latency Video Streaming
VietFood67	Now I Know What I am Eating: Real-time Tracking and Nutritional Insights Using VietFood67 to Enhance User Experience
Vietnamese	A Lightweight End-to-End Multi-task Learning System for Vietnamese Speaker Verification
Vietnamese food dataset	Now I Know What I am Eating: Real-time Tracking and Nutritional Insights Using VietFood67 to Enhance User Experience
Vietnamese treebank	Domain Generalization in Vietnamese Dependency Parsing: A Novel Benchmark and Domain Gap Analysis
Vietnamese-Khmer	Improving Quality of Vietnamese to Khmer Neural Machine Translation Using Multi-stage Fine-tuning Strategy
VietTreeBank	An Attempt to Develop a Neural Parser based on Simplified Head-Driven Phrase Structure Grammar on Vietnamese
Virtual Assistant	Developing a Mobile Virtual Assistant using Large Language Models for Task Automation
Virtual keyboard	Budget-Aware Keyboardless Interaction
Virtual Reality	Towards Enabling Tangible Interaction with Physical Objects in Virtual Reality Desktop Workplaces Evaluation of AI-Based Assistant Representations on User Interaction in Virtual Explorations
VisChronos Framework	VisChronos: Revolutionizing Image Captioning Through Real-Life Events
Vision Transformer	Cardio Care: A Vision Transformer Cardiac Classification based on Electrocardiogram Images and Signals Decoding Deepfakes: Caption Guided Learning for Robust Deepfake Detection AI-Generated Image Recognition via Fusion of CNNs and Vision Transformers
Vision Transformer-H/14	ArtemisSearch: A Multimodal Search Engine for Efficient Video Log-Life Event Retrieval Using Time-Segmented Queries and Vision Transformer-based Feature Extraction
Vision-Language model	KidRisk: Benchmark Dataset for Children Dangerous Action Recognition Decoding Deepfakes: Caption Guided Learning for Robust Deepfake Detection
Vision-Language Models	Enhanced Video Event Retrieval through Adaptive Multi-Model Fusion with Large Language Models
Visual Embedding	Event Retrieval from Large Video Collection in Ho Chi Minh City AI Challenge 2024
Visual Question Answering	CESE: A Clip-based Event Search Engine for AI Challenge HCMC 2024
Visual Sensor Network	H-LSHADE: An Efficient Hybrid Approach for Solving Heterogeneous Target Coverage in Visual Sensor Networks
Visual-Textual Embedding	LameFrames: Optimizing Video Event Retrieval Through Strategic Integration and Individual Strategy Enhancement
VnDT	An Attempt to Develop a Neural Parser based on Simplified Head-Driven Phrase Structure Grammar on Vietnamese
VR	VOI-VR:Voice-driven Object Interaction in Virtual Reality with Large Language Models
VR agent	Evaluation of AI-Based Assistant Representations on User Interaction in Virtual Explorations
VSum-HB	VSum-HB: A Vietnamese Text Summarization Dataset For Reinforcement Learning From Human Feedback
W
Weak supervision	BKCrawler: A Scalable Web Data Extraction System Using Weak Supervision
Web application security	Towards a Unified Delegated Authorization Framework for Microservice-based ERP Systems
Web Cookies Classification	A User Privacy Risk - Driven Approach to Web Cookie Classification
Web data extraction	BKCrawler: A Scalable Web Data Extraction System Using Weak Supervision
WebSocket	Real-Time Multi-User Multimedia Event Retrieval Application System Using WebSocket Protocol
WebTransport	An Evaluation of HTTP/3 and WebTransport over QUIC in Live Low Latency Video Streaming
Whisper	Towards Unsupervised Speaker Diarization System for Multilingual Telephone Calls Using Pre-trained Whisper Model and Mixture of Sparse Autoencoders
WhisperX	MAVERICS: Multimodal Advanced Visual Event Retrieval with Integrated CPU-Optimized Search
Wireless Sensor Network	A MAC Protocol for multi-cluster scheduling based on geographical segmentation and Precoloring Extension
Word Embeddings	Leveraging Dynamic Graph Word Embedding for Efficient Contextual Representations
X
X-ray Images	Knowledge Distillation for Lumbar Spine X-ray Classification
Y
YOLO	Benchmarking Real-Time Object Detection: Evaluating YOLO and RT-DETR on Speed, Accuracy, and Efficiency EPC-YOLOv7: The Proposed One-stage Detector for Aerial Scenario Detection
YOLO model	AYO-GAN: A novel GAN-based adversarial attack on YOLO object detection models
YOLOv10	Now I Know What I am Eating: Real-time Tracking and Nutritional Insights Using VietFood67 to Enhance User Experience
YOLOv8-L	A User Privacy Risk - Driven Approach to Web Cookie Classification
YOLOWorldv2	MAVERICS: Multimodal Advanced Visual Event Retrieval with Integrated CPU-Optimized Search
Z
Zero-shot counting	Distribution-Guided Object Counting with Optimal Transport and DINO-Based density Refinement