Source code for sample_id.fingerprint.fingerprint

from __future__ import annotations

import logging
import os
from typing import Iterable, Optional

import numpy as np

logger = logging.getLogger(__name__)


[docs]def from_file(audio_path, id, sr, hop_length=512, feature="sift") -> Fingerprint:
    if feature == "sift":
        from . import sift

        return sift.from_file(audio_path, id, sr, hop_length)
    else:
        raise NotImplementedError


[docs]def load(filepath: str) -> Fingerprint:
    with np.load(filepath) as data:
        return Fingerprint(
            data["keypoints"],
            data["descriptors"],
            data["id"].item(),
            data["sr"].item(),
            data["hop"].item(),
        )


[docs]class Fingerprint:
    spectrogram = NotImplemented

    def __init__(self, keypoints, descriptors, id, sr, hop_length):
        self.keypoints = keypoints
        self.descriptors = descriptors
        self.id = id
        self.sr = sr
        self.hop_length = hop_length

[docs]    def remove_similar_keypoints(self):
        if len(self.descriptors) > 0:
            logger.info("Removing duplicate/similar keypoints...")
            a = np.array(self.descriptors)
            rounding_factor = 10
            b = np.ascontiguousarray((a // rounding_factor) * rounding_factor).view(
                np.dtype((np.void, a.dtype.itemsize * a.shape[1]))
            )
            _, idx = np.unique(b, return_index=True)
            desc = a[sorted(idx)]
            kp = np.array([k for i, k in enumerate(self.keypoints) if i in idx])
            logger.info("Removed {} duplicate keypoints".format(a.shape[0] - idx.shape[0]))
            self.keypoints = kp
            self.descriptors = desc

[docs]    def keypoint_ms(self, kp) -> int:
        return int(kp[0] * self.hop_length * 1000.0 / self.sr)

[docs]    def keypoint_index_ids(self):
        return np.repeat(self.id, self.keypoints.shape[0])

[docs]    def keypoint_index_ms(self):
        return np.array([self.keypoint_ms(kp) for kp in self.keypoints], dtype=np.uint32)

[docs]    def save_to_dir(self, dir: str, compress=True):
        filepath = os.path.join(dir, self.id)
        self.save(filepath)

[docs]    def save(self, filepath: str, compress: bool = True):
        save_fn = np.savez_compressed if compress else np.savez
        save_fn(
            filepath,
            keypoints=self.keypoints,
            descriptors=self.descriptors,
            sr=self.sr,
            hop=self.hop_length,
            id=self.id,
        )

    def __repr__(self):
        return f"Fingerprint({self.id})"


[docs]def save_fingerprints(fingerprints: Iterable[Fingerprint], filepath: str, compress=True):
    # TODO: try structured arrays: https://docs.scipy.org/doc/numpy-1.13.0/user/basics.rec.html
    keypoints = np.vstack([fp.keypoints for fp in fingerprints])
    descriptors = np.vstack([fp.descriptors for fp in fingerprints])
    index_to_id = np.hstack([fp.keypoint_index_ids() for fp in fingerprints])
    index_to_ms = np.hstack([fp.keypoint_index_ms() for fp in fingerprints])
    save_fn = np.savez_compressed if compress else np.savez
    save_fn(
        filepath,
        keypoints=keypoints,
        descriptors=descriptors,
        index_to_id=index_to_id,
        index_to_ms=index_to_ms,
    )


[docs]def load_fingerprints(filepath: str) -> Fingerprints:
    with np.load(filepath) as data:
        return Fingerprints(data["keypoints"], data["descriptors"], data["index_to_id"], data["index_to_ms"])


[docs]class Fingerprints:
    def __init__(self, keypoints, descriptors, index_to_id, index_to_ms):
        self.keypoints = keypoints
        self.descriptors = descriptors
        self.index_to_id = index_to_id
        self.index_to_ms = index_to_ms


[docs]class LazyFingerprints(Fingerprints):
    def __init__(self, npz_filepath: str):
        self.data = np.load(npz_filepath, mmap_mode="r")

    @property
    def keypoints(self):
        return self.data["keypoints"]

    @property
    def descriptors(self):
        return self.data["descriptors"]

    @property
    def index_to_id(self):
        return self.data["index_to_id"]

    @property
    def index_to_ms(self):
        return self.data["index_to_ms"]

    @property
    def keypoints(self):
        return self.data["keypoints"]