Multimodale Perzeption für soziale Interaktion mit einem virtuellen Agenten