252 lines
7.9 KiB
C++
252 lines
7.9 KiB
C++
|
#include <iostream>
|
||
|
using namespace std;
|
||
|
|
||
|
#include <stdio.h>
|
||
|
#include <stdlib.h>
|
||
|
#include <math.h>
|
||
|
#include <limits.h>
|
||
|
#include <alsa/asoundlib.h>
|
||
|
#include "/usr/include/alsa/asoundlib.h"
|
||
|
|
||
|
//#define SAMPLE_TYPE float
|
||
|
//#define SAMPLE_TYPE_ALSA SND_PCM_FORMAT_FLOAT_LE
|
||
|
|
||
|
#define SAMPLE_TYPE short //sample type = type d'echantillon
|
||
|
#define SAMPLE_TYPE_ALSA SND_PCM_FORMAT_S16_LE
|
||
|
|
||
|
/**
|
||
|
* classe permettant de calculer la moyenne glissante du signal
|
||
|
*/
|
||
|
class MoyenneGlissante {
|
||
|
int _nbDeValeursPrMoy;
|
||
|
int _nbDeValeurs;
|
||
|
float _mean;
|
||
|
|
||
|
public:
|
||
|
MoyenneGlissante(int nbDeValeursPrMoy) {
|
||
|
_nbDeValeursPrMoy = nbDeValeursPrMoy;
|
||
|
_mean = 0;
|
||
|
_nbDeValeurs = 0;
|
||
|
}
|
||
|
|
||
|
void nvelleValeur(SAMPLE_TYPE v) {
|
||
|
if (_nbDeValeurs < _nbDeValeursPrMoy)
|
||
|
_nbDeValeurs++;
|
||
|
_mean = ((_mean * (_nbDeValeurs - 1)) + v) / (float)_nbDeValeurs;
|
||
|
}
|
||
|
|
||
|
SAMPLE_TYPE getMean() {
|
||
|
return (SAMPLE_TYPE) _mean;
|
||
|
}
|
||
|
};
|
||
|
|
||
|
/**
|
||
|
* Cette classe calcule la direction du son entendu
|
||
|
*
|
||
|
*
|
||
|
* Elle utilise 2 microphones et calcule la différence de temps d'arrivée des sons entre eux pour
|
||
|
* estimer la localisation de la source sonore.
|
||
|
*/
|
||
|
class Localisation {
|
||
|
|
||
|
/**
|
||
|
* Décalage maximum entre le micro droit et gauche en nombre d'échantillons.
|
||
|
* Cela dépend généralement de la fréquence d'échantillonnage et de la distance entre
|
||
|
* microphones
|
||
|
*/
|
||
|
static const int _nbEchantillonsDiffMax = 13; //difference max du nombre d'echantillons
|
||
|
|
||
|
/**
|
||
|
* Taille du tampon sur laquelle nous allons essayer de localiser le son.
|
||
|
* Ceci est un certain nombre d'échantillons, et dépend de la fréquence d'échantillonnage et de la vitesse de
|
||
|
* changement de loc son que nous voulons détecter. Des valeurs plus faibles signifient le calcul du son
|
||
|
* se fait plus souvent, mais la précision est assez faible car nous calculons sur une très petite tranche de
|
||
|
* du son.
|
||
|
*/
|
||
|
static const int _TailleTampon = 4096;
|
||
|
|
||
|
/**
|
||
|
* Prenez un point pour la localisation du son est Niveau> 105% du Niveau moyen. Cela permet de calculer la
|
||
|
* localisation du son uniquement pour les sons "significatifs", pas le bruit de fond.
|
||
|
*/
|
||
|
static constexpr float _NiveauSonMin = 1.1f; //f de 1.05f signifie :float constant with value of 1.05
|
||
|
|
||
|
/**
|
||
|
* sound speed in meters per seconds
|
||
|
*/
|
||
|
static constexpr float _Vson = 344;
|
||
|
|
||
|
/**
|
||
|
* sound sampling rate in Hz
|
||
|
*/
|
||
|
unsigned int _TauxEchantillonnageSon;
|
||
|
|
||
|
/**
|
||
|
* Distance between microphones in meters
|
||
|
*/
|
||
|
static constexpr float _DistanceMic = 0.05f;//5 cm de distance entre les deux microphones
|
||
|
|
||
|
/** An utility to compute the running average of sound power */
|
||
|
MoyenneGlissante* _MoyNivSonore;
|
||
|
|
||
|
/** ALSA sound input handle */
|
||
|
snd_pcm_t* _capture_handle;
|
||
|
|
||
|
/** sound samples input buffer */
|
||
|
SAMPLE_TYPE _TamponDroit[_TailleTampon];
|
||
|
SAMPLE_TYPE _TamponGauche[_TailleTampon];
|
||
|
|
||
|
public:
|
||
|
Localisation() {
|
||
|
_MoyNivSonore = new MoyenneGlissante(50);
|
||
|
_TauxEchantillonnageSon = 44100;
|
||
|
|
||
|
// sampling: 2 chanels, 44 KHz, 16 bits.
|
||
|
int err;
|
||
|
snd_pcm_hw_params_t* hw_params;
|
||
|
|
||
|
// ideally use "hw:0,0" for embedded, to limit processing. But check if card support our needs...
|
||
|
const char* CarteSon = "plughw:0,0";
|
||
|
if ((err = snd_pcm_open(&_capture_handle, CarteSon, SND_PCM_STREAM_CAPTURE, 0)) < 0) {
|
||
|
fprintf(stderr, "Impossible d'ouvrir le peripherique audio %s (%s)\n", CarteSon,snd_strerror(err));
|
||
|
exit(1);
|
||
|
}
|
||
|
|
||
|
if ((err = snd_pcm_hw_params_malloc(&hw_params)) < 0) {
|
||
|
fprintf(stderr, "Impossible d'allouer la structure des paramètres matériels (%s)\n",snd_strerror(err));
|
||
|
exit(1);
|
||
|
}
|
||
|
|
||
|
if ((err = snd_pcm_hw_params_any(_capture_handle, hw_params)) < 0) {
|
||
|
fprintf(stderr,"Impossible d'initialiser la structure des paramètres matériels (%s)\n",snd_strerror(err));
|
||
|
exit(1);
|
||
|
}
|
||
|
|
||
|
if ((err = snd_pcm_hw_params_set_access(_capture_handle, hw_params,SND_PCM_ACCESS_RW_NONINTERLEAVED)) < 0) {
|
||
|
fprintf(stderr, "Impossible de definir le type d'acces (%s)\n", snd_strerror(err));
|
||
|
exit(1);
|
||
|
}
|
||
|
|
||
|
if ((err = snd_pcm_hw_params_set_format(_capture_handle, hw_params,SAMPLE_TYPE_ALSA)) < 0) {
|
||
|
fprintf(stderr, "Impossible de definir le format d'echantillonnage (%s)\n",snd_strerror(err));
|
||
|
exit(1);
|
||
|
}
|
||
|
|
||
|
if ((err = snd_pcm_hw_params_set_rate_near(_capture_handle, hw_params,&_TauxEchantillonnageSon, 0)) < 0) {
|
||
|
fprintf(stderr, "Impossible de definir le taux d'echantillonnage (%s)\n", snd_strerror(err));
|
||
|
exit(1);
|
||
|
}
|
||
|
|
||
|
if ((err = snd_pcm_hw_params_set_channels(_capture_handle, hw_params, 2))< 0) {
|
||
|
fprintf(stderr, "Impossible de definir le nombre de canaux (%s)\n", snd_strerror(err));
|
||
|
exit(1);
|
||
|
}
|
||
|
|
||
|
if ((err = snd_pcm_hw_params(_capture_handle, hw_params)) < 0) {
|
||
|
fprintf(stderr, "Impossible de definir les parametres (%s)\n", snd_strerror(err));
|
||
|
exit(1);
|
||
|
}
|
||
|
|
||
|
snd_pcm_hw_params_free(hw_params);
|
||
|
|
||
|
if ((err = snd_pcm_prepare(_capture_handle)) < 0) {
|
||
|
fprintf(stderr, "Impossible de preparer l'interface audio pour utilisation (%s)\n",snd_strerror(err));
|
||
|
exit(1);
|
||
|
}
|
||
|
}
|
||
|
|
||
|
/** Clean exit */
|
||
|
~Localisation() {
|
||
|
snd_pcm_close(_capture_handle);
|
||
|
delete _MoyNivSonore;
|
||
|
}
|
||
|
|
||
|
/**
|
||
|
* Boucle principale: lit un tampon, calcule la localisation de la source sonore, fait une itération.
|
||
|
*/
|
||
|
void run() {
|
||
|
while (true) {
|
||
|
TraitementSonsSuivants();
|
||
|
}
|
||
|
}
|
||
|
|
||
|
private:
|
||
|
/**
|
||
|
* C'est le cœur de la localisation de la source sonore: il prend les sons échantillonnés
|
||
|
* Droit / Gauche, et calcule leurs différences tout en retardant de plus en plus un canal.<br/>
|
||
|
* => le retard pour lequel la différence est minime est le vrai retard
|
||
|
* entre les sons Droit / Gauche, dont on peut déduire la source sonore
|
||
|
* localisation
|
||
|
*/
|
||
|
void TraitementSonsSuivants() {
|
||
|
SAMPLE_TYPE* bufs[3];
|
||
|
bufs[0] = _TamponDroit;
|
||
|
bufs[1] = _TamponGauche;
|
||
|
bufs[2] = _TamponAvant;
|
||
|
int err;
|
||
|
if ((err = snd_pcm_readn(_capture_handle, (void**) bufs, _TailleTampon))!= _TailleTampon) {
|
||
|
fprintf(stderr, "Echec de la lecture de l'interface audio (%s)\n",snd_strerror(err));
|
||
|
exit(1);
|
||
|
}
|
||
|
|
||
|
// compute the sound level (i.e. "loudness" of the sound):
|
||
|
SAMPLE_TYPE Niveau = CalculNiv(_TamponDroit, _TamponGauche, _TamponAvant);
|
||
|
// update the average sound level with this new measure:
|
||
|
_MoyNivSonore->nvelleValeur(Niveau);
|
||
|
// relative sound level of this sample compared to average:
|
||
|
float NivRelatif = (float) Niveau / (float) _MoyNivSonore->getMean();
|
||
|
//cout << "level " << level << ", relative " << NivRelatif << endl;
|
||
|
|
||
|
int minDiff = INT_MAX;
|
||
|
int minDiffTime = -1;
|
||
|
// glisse sur l'axe du temps pour trouver la différence sonore minimum entre les microphones Droit et Gauche
|
||
|
for (int t = -_nbEchantillonsDiffMax; t < _nbEchantillonsDiffMax; t++) {
|
||
|
// calcule la somme des différences pour simuler une mesure de corrélation croisée:
|
||
|
int diff = 0;
|
||
|
int diff2 = 0;
|
||
|
for (int i = _nbEchantillonsDiffMax; i < _TailleTampon - _nbEchantillonsDiffMax - 1; i++) {
|
||
|
diff += abs(_TamponGauche[i] - _TamponDroit[i + t]);
|
||
|
diff2 += abs(_TamponGauche[i] - _TamponDroit[i + t]);
|
||
|
}
|
||
|
if (diff < minDiff) {
|
||
|
minDiff = diff;
|
||
|
minDiffTime = t;
|
||
|
}
|
||
|
|
||
|
if (diff2 < minDiff) {
|
||
|
minDiff = diff;
|
||
|
minDiffTime = t;
|
||
|
}
|
||
|
}
|
||
|
|
||
|
// Si le son est assez fort et pas extrême (= ce qui entraine généralement de fausses
|
||
|
// mesures), alors on le dessine:
|
||
|
if ((NivRelatif > _NiveauSonMin) && (minDiffTime > -_nbEchantillonsDiffMax) && (minDiffTime < _nbEchantillonsDiffMax)) {
|
||
|
// computation of angle depending on diff time, sampling rates,
|
||
|
// and geometry
|
||
|
float angle = -(float) asin((minDiffTime * _Vson) / (_TauxEchantillonnageSon* _DistanceMic));
|
||
|
cout << angle << ";" << NivRelatif << endl;
|
||
|
}
|
||
|
}
|
||
|
|
||
|
/**
|
||
|
* Calcule du niveau sonore moyen (la puissance) pour les canaux gauche et droit.
|
||
|
*/
|
||
|
SAMPLE_TYPE CalculNiv(SAMPLE_TYPE Droit[], SAMPLE_TYPE Gauche[], SAMPLE_TYPE Avant[]) {
|
||
|
float Niveau = 0;
|
||
|
for (int i = 0; i < _TailleTampon; i++) {
|
||
|
float s = (Gauche[i] + Droit[i]+ Avant[i]) / 3;
|
||
|
Niveau += (s * s);
|
||
|
}
|
||
|
Niveau /= _TailleTampon;
|
||
|
Niveau = sqrt(Niveau);
|
||
|
return (SAMPLE_TYPE) Niveau;
|
||
|
}
|
||
|
};
|
||
|
|
||
|
int main(int argc, char *argv[]) {
|
||
|
Localisation soundLoc;
|
||
|
soundLoc.run();
|
||
|
exit(0);
|
||
|
}
|