localisation_audio/Localisation_360/Localisation_v2.0.0.cpp

252 lines
7.9 KiB
C++

#include <iostream>
using namespace std;
#include <stdio.h>
#include <stdlib.h>
#include <math.h>
#include <limits.h>
#include <alsa/asoundlib.h>
#include "/usr/include/alsa/asoundlib.h"
//#define SAMPLE_TYPE float
//#define SAMPLE_TYPE_ALSA SND_PCM_FORMAT_FLOAT_LE
#define SAMPLE_TYPE short //sample type = type d'echantillon
#define SAMPLE_TYPE_ALSA SND_PCM_FORMAT_S16_LE
/**
* classe permettant de calculer la moyenne glissante du signal
*/
class MoyenneGlissante {
int _nbDeValeursPrMoy;
int _nbDeValeurs;
float _mean;
public:
MoyenneGlissante(int nbDeValeursPrMoy) {
_nbDeValeursPrMoy = nbDeValeursPrMoy;
_mean = 0;
_nbDeValeurs = 0;
}
void nvelleValeur(SAMPLE_TYPE v) {
if (_nbDeValeurs < _nbDeValeursPrMoy)
_nbDeValeurs++;
_mean = ((_mean * (_nbDeValeurs - 1)) + v) / (float)_nbDeValeurs;
}
SAMPLE_TYPE getMean() {
return (SAMPLE_TYPE) _mean;
}
};
/**
* Cette classe calcule la direction du son entendu
*
*
* Elle utilise 2 microphones et calcule la différence de temps d'arrivée des sons entre eux pour
* estimer la localisation de la source sonore.
*/
class Localisation {
/**
* Décalage maximum entre le micro droit et gauche en nombre d'échantillons.
* Cela dépend généralement de la fréquence d'échantillonnage et de la distance entre
* microphones
*/
static const int _nbEchantillonsDiffMax = 13; //difference max du nombre d'echantillons
/**
* Taille du tampon sur laquelle nous allons essayer de localiser le son.
* Ceci est un certain nombre d'échantillons, et dépend de la fréquence d'échantillonnage et de la vitesse de
* changement de loc son que nous voulons détecter. Des valeurs plus faibles signifient le calcul du son
* se fait plus souvent, mais la précision est assez faible car nous calculons sur une très petite tranche de
* du son.
*/
static const int _TailleTampon = 4096;
/**
* Prenez un point pour la localisation du son est Niveau> 105% du Niveau moyen. Cela permet de calculer la
* localisation du son uniquement pour les sons "significatifs", pas le bruit de fond.
*/
static constexpr float _NiveauSonMin = 1.1f; //f de 1.05f signifie :float constant with value of 1.05
/**
* sound speed in meters per seconds
*/
static constexpr float _Vson = 344;
/**
* sound sampling rate in Hz
*/
unsigned int _TauxEchantillonnageSon;
/**
* Distance between microphones in meters
*/
static constexpr float _DistanceMic = 0.05f;//5 cm de distance entre les deux microphones
/** An utility to compute the running average of sound power */
MoyenneGlissante* _MoyNivSonore;
/** ALSA sound input handle */
snd_pcm_t* _capture_handle;
/** sound samples input buffer */
SAMPLE_TYPE _TamponDroit[_TailleTampon];
SAMPLE_TYPE _TamponGauche[_TailleTampon];
public:
Localisation() {
_MoyNivSonore = new MoyenneGlissante(50);
_TauxEchantillonnageSon = 44100;
// sampling: 2 chanels, 44 KHz, 16 bits.
int err;
snd_pcm_hw_params_t* hw_params;
// ideally use "hw:0,0" for embedded, to limit processing. But check if card support our needs...
const char* CarteSon = "plughw:0,0";
if ((err = snd_pcm_open(&_capture_handle, CarteSon, SND_PCM_STREAM_CAPTURE, 0)) < 0) {
fprintf(stderr, "Impossible d'ouvrir le peripherique audio %s (%s)\n", CarteSon,snd_strerror(err));
exit(1);
}
if ((err = snd_pcm_hw_params_malloc(&hw_params)) < 0) {
fprintf(stderr, "Impossible d'allouer la structure des paramètres matériels (%s)\n",snd_strerror(err));
exit(1);
}
if ((err = snd_pcm_hw_params_any(_capture_handle, hw_params)) < 0) {
fprintf(stderr,"Impossible d'initialiser la structure des paramètres matériels (%s)\n",snd_strerror(err));
exit(1);
}
if ((err = snd_pcm_hw_params_set_access(_capture_handle, hw_params,SND_PCM_ACCESS_RW_NONINTERLEAVED)) < 0) {
fprintf(stderr, "Impossible de definir le type d'acces (%s)\n", snd_strerror(err));
exit(1);
}
if ((err = snd_pcm_hw_params_set_format(_capture_handle, hw_params,SAMPLE_TYPE_ALSA)) < 0) {
fprintf(stderr, "Impossible de definir le format d'echantillonnage (%s)\n",snd_strerror(err));
exit(1);
}
if ((err = snd_pcm_hw_params_set_rate_near(_capture_handle, hw_params,&_TauxEchantillonnageSon, 0)) < 0) {
fprintf(stderr, "Impossible de definir le taux d'echantillonnage (%s)\n", snd_strerror(err));
exit(1);
}
if ((err = snd_pcm_hw_params_set_channels(_capture_handle, hw_params, 2))< 0) {
fprintf(stderr, "Impossible de definir le nombre de canaux (%s)\n", snd_strerror(err));
exit(1);
}
if ((err = snd_pcm_hw_params(_capture_handle, hw_params)) < 0) {
fprintf(stderr, "Impossible de definir les parametres (%s)\n", snd_strerror(err));
exit(1);
}
snd_pcm_hw_params_free(hw_params);
if ((err = snd_pcm_prepare(_capture_handle)) < 0) {
fprintf(stderr, "Impossible de preparer l'interface audio pour utilisation (%s)\n",snd_strerror(err));
exit(1);
}
}
/** Clean exit */
~Localisation() {
snd_pcm_close(_capture_handle);
delete _MoyNivSonore;
}
/**
* Boucle principale: lit un tampon, calcule la localisation de la source sonore, fait une itération.
*/
void run() {
while (true) {
TraitementSonsSuivants();
}
}
private:
/**
* C'est le cœur de la localisation de la source sonore: il prend les sons échantillonnés
* Droit / Gauche, et calcule leurs différences tout en retardant de plus en plus un canal.<br/>
* => le retard pour lequel la différence est minime est le vrai retard
* entre les sons Droit / Gauche, dont on peut déduire la source sonore
* localisation
*/
void TraitementSonsSuivants() {
SAMPLE_TYPE* bufs[3];
bufs[0] = _TamponDroit;
bufs[1] = _TamponGauche;
bufs[2] = _TamponAvant;
int err;
if ((err = snd_pcm_readn(_capture_handle, (void**) bufs, _TailleTampon))!= _TailleTampon) {
fprintf(stderr, "Echec de la lecture de l'interface audio (%s)\n",snd_strerror(err));
exit(1);
}
// compute the sound level (i.e. "loudness" of the sound):
SAMPLE_TYPE Niveau = CalculNiv(_TamponDroit, _TamponGauche, _TamponAvant);
// update the average sound level with this new measure:
_MoyNivSonore->nvelleValeur(Niveau);
// relative sound level of this sample compared to average:
float NivRelatif = (float) Niveau / (float) _MoyNivSonore->getMean();
//cout << "level " << level << ", relative " << NivRelatif << endl;
int minDiff = INT_MAX;
int minDiffTime = -1;
// glisse sur l'axe du temps pour trouver la différence sonore minimum entre les microphones Droit et Gauche
for (int t = -_nbEchantillonsDiffMax; t < _nbEchantillonsDiffMax; t++) {
// calcule la somme des différences pour simuler une mesure de corrélation croisée:
int diff = 0;
int diff2 = 0;
for (int i = _nbEchantillonsDiffMax; i < _TailleTampon - _nbEchantillonsDiffMax - 1; i++) {
diff += abs(_TamponGauche[i] - _TamponDroit[i + t]);
diff2 += abs(_TamponGauche[i] - _TamponDroit[i + t]);
}
if (diff < minDiff) {
minDiff = diff;
minDiffTime = t;
}
if (diff2 < minDiff) {
minDiff = diff;
minDiffTime = t;
}
}
// Si le son est assez fort et pas extrême (= ce qui entraine généralement de fausses
// mesures), alors on le dessine:
if ((NivRelatif > _NiveauSonMin) && (minDiffTime > -_nbEchantillonsDiffMax) && (minDiffTime < _nbEchantillonsDiffMax)) {
// computation of angle depending on diff time, sampling rates,
// and geometry
float angle = -(float) asin((minDiffTime * _Vson) / (_TauxEchantillonnageSon* _DistanceMic));
cout << angle << ";" << NivRelatif << endl;
}
}
/**
* Calcule du niveau sonore moyen (la puissance) pour les canaux gauche et droit.
*/
SAMPLE_TYPE CalculNiv(SAMPLE_TYPE Droit[], SAMPLE_TYPE Gauche[], SAMPLE_TYPE Avant[]) {
float Niveau = 0;
for (int i = 0; i < _TailleTampon; i++) {
float s = (Gauche[i] + Droit[i]+ Avant[i]) / 3;
Niveau += (s * s);
}
Niveau /= _TailleTampon;
Niveau = sqrt(Niveau);
return (SAMPLE_TYPE) Niveau;
}
};
int main(int argc, char *argv[]) {
Localisation soundLoc;
soundLoc.run();
exit(0);
}