什么是 face-api.js
JavaScript API for face detection and face recognition in the browser and nodejs with tensorflow.js
face-api.js 是在 tensorflow.js 核心(tensorflow/tfjs-core)之上实现的浏览器和 nodejs 的 JavaScript 人脸识别 API。
目前 face-api.js 在 Github 通过 MIT 协议开源,有超过 16.1k 的 star、3.6k 的 fork、8.7k 的项目依赖量、是一个妥妥的前端优质开源项目。
如何使用 face-api.js
开发者可以通过 Polyfill 一些浏览器细节,例如: HTMLImageElement、HTMLCanvasElement 和 ImageData 等在 Nodejs 环境中使用等效的 API,最简单的方法是安装 node-canvas 包。
或者,可以简单地从图像数据构造自己的张量,并将张量作为输入传递给 API。此外,强烈推荐安装 @tensorflow/tfjs-node(不是必需的,但强烈推荐),其通过编译和绑定到本机 Tensorflow C++ 库来大大加快速度。下面是引用face-api.js的代码示例:
// 将 NodeJS 绑定导入到本机 Tensorflow,
// 不是必需的,但会大大加快速度(需要 python)
import '@tensorflow/tfjs-node';
// 实现 HTMLCanvasElement、HTMLImageElement、ImageData 的 Nodejs 包装器
import * as canvas from 'canvas';
import * as faceapi from 'face-api.js';
// patch nodejs 环境, 提供 HTMLCanvasElement and HTMLImageElement 实现
const {Canvas, Image, ImageData} = canvas
faceapi.env.monkeyPatch({Canvas, Image, ImageData})
如果要加载模型可以通过下面的方法:
await faceapi.nets.ssdMobilenetv1.loadFromDisk('./models')
// 从磁盘加载
await faceapi.nets.ssdMobilenetv1.loadFromWeightMap(weightMap)
// 从 tf.NamedTensorMap 加载模型
const net = new faceapi.SsdMobilenetv1()
await net.loadFromUri('/models')
// 创建自己的神经网络实例
net.load(await faceapi.fetchNetWeights('/models/face_detection_model.weights'))
// 将权重作为 Float32Array 加载(如果想使用未压缩的模型)
加载模型后,可以通过下面的方法来识别人脸:
const detections = await faceapi.detectAllFaces(input)
// 检测图像中的所有面部
const detection = await faceapi.detectSingleFace(input)
// 检测图像中置信度得分最高的人脸
const detections1 = await faceapi.detectAllFaces(input, new faceapi.SsdMobilenetv1Options())
const detections2 = await faceapi.detectAllFaces(input, new faceapi.TinyFaceDetectorOptions())
// DetectAllFaces 和 detectorSingleFace 使用 SSD Mobilenet V1 人脸检测器
// 开发者还可以通过传递相应的选项对象来指定面部检测器
人脸检测后还可以进一步预测每个检测到的人脸的面部标志,如下所示:
const detectionsWithLandmarks = await faceapi.detectAllFaces(input).withFaceLandmarks()
以上代码检测图像中的所有面部 + 为每个检测到的面部计算 68 点面部标志。如果只需要监测单张脸,可以通过下面的代码完成:
const detectionWithLandmarks = await faceapi.detectSingleFace(input).withFaceLandmarks()
开发者还可以调整模型,比如:使用微型模型而不是默认模型:
const useTinyModel = true
const detectionsWithLandmarks = await faceapi.detectAllFaces(input).withFaceLandmarks(useTinyModel)
face-api.js 的高级用法和示例
https://github.com/justadudewhohacks/face-api.js/
https://www.youtube.com/watch?app=desktop&v=CVClHLwv-4I
为您推荐
近几年,“AI 浏览器”开始成为市场热点。不同于传统浏览器只是用来浏览网页、管理标签页,AI 浏览器整合了大语言模型、智能搜索、自动化任务等功能,旨在提升“浏览即生产力”的体验。在这一浪..
ChatGPT Atlas:AI 浏览器新纪元,开启共同行动的未来当地时间 10 月 21 日,OpenAI 正式宣布推出其首款 AI 驱动的网页浏览器——ChatGPT Atlas。这一举措标志着人工智能巨头对传统互联网入口发起了正面挑..
在 AI 助手与智能搜索迅速渗透互联网的时代,浏览器正在从“展示网页”的工具,逐渐演变为带有智能 “代理/助理” 能力的平台。近日,Perplexity 宣布其 AI 浏览器 Comet(原本只限部分用户使用..
近年来,AI 技术正在深度重塑互联网体验。作为 Perplexity 旗下的 AI 浏览器,Comet 现已向全球所有用户免费开放,这意味着每个人都能免费体验其集成的智能助手与搜索能力。Comet 不再只是传统浏览器的扩展,而是一..
什么是 ua-parser-js?ua-parser-js 是一个轻量级的 JavaScript 库,旨在解析用户代理(User-Agent)字符串,从中提取出浏览器、操作系统、设备类型、CPU 架构等信息。它支持在浏览器(客户端)和 Node.js(服务端)..
在人工智能日益融入日常生活的今天,浏览器作为我们接触互联网的主要工具,也在发生着深刻的变革。由 Arc 浏览器开发团队 The Browser Company 推出的全新 AI 浏览器——Dia,正是这一变革的代表。Dia 不..
最近招聘面试测试工程师,发现很多测试工程师都是半路出家,对一些基本的测试概念,思路与技术没有认知。在设计测试用例的时候只是基于直觉与经验去测试。这就导致测试用例的设计既不全面,也不科学。一般功能测试指..
html2canvas 是一个开源的 JavaScript 库,用于将网页上的 HTML 元素渲染成图像。它通过遍历页面的 DOM 树和计算样式,然后将其绘制到 <canvas> 元素上,最终生成图片。该库不依赖服务器端,而是通过浏览器端的 Java..
网站数据统计分析工具是网站站长和运营人员经常使用的一种工具,比较常用的有谷歌分析、百度统计和腾讯分析等等。所有这些统计分析工具的第一步都是网站访问数据的收集。目前主流的数据收集方式基本都是基于javascri..
在大部分Web系统中,我们可能遇到需要向客户端推送消息的需求。SuperWebSocket第三方库能让我们轻松的完成任务。SuperWebSocket第三方库可以从网上下载,不过通过Visual Studio Nuget安装更快。引用SuperWebSocket相..
C# 是一种面向对象的编程语言,具有丰富的类库和工具支持,适用于各种类型的应用程序开发。Windows 提供了一种称为"钩子"(Hook)的机制,允许拦截并处理系统级别的事件,如键盘按键和鼠标移动。通过结合 C# 和 Hook..
在 .NET 中可以使用 System.Net.FtpWebRequest 类来连接 FTP 服务器,实现文件上传和下载。以下是实现文件上传和下载的完整代码示例。1. 上传文件到 FTP 服务器using System;using System.IO;using System.Net;class..
在 C# 中,通过自定义 Attribute 并结合一些技术(如动态代理、反射等)可以实现 AOP(面向切面编程)。AOP 通常用于日志记录、性能监控、权限验证等横切关注点。以下是一个使用 C# Attribute 实现 AOP 功能的示例。..
只需要简单的3步:1,到官网下载模版项目 https://aspnetboilerplate.com/Templates2,用VS2017打开,将Web.Host设置为启动项3,在程序包管理器控制台(Nuget控制台)里设定默认项目为EntityFrameworkCore,执行命令..
在多线程编程中,如何安全地在不同线程之间共享数据是一个非常重要的问题。C# 为我们提供了一些专门设计的线程安全集合,其中之一就是 ConcurrentQueue<T>。它是一种先进先出(FIFO)的数据结构,专门为多线程环境设..
CSS砌体布局(Masonry Layout)CSS砌体布局是一种网页布局技术,它的灵感来源于砖石墙的排列方式,类似于“拼图”或“拼砖”的效果。在砌体布局中,元素的排列并不完全遵循传统的网格布局规则,..
CSS的 columns 属性(如 columns、column-count 和 column-width)通常用于多列文本布局,而不是直接用于砌体布局。然而,结合 columns 和 visibility 属性,可以在某些情况下实现类似砌体布局的效果,虽然它并不完..
System.Linq.Dynamic.Core 是一个扩展库,用于在运行时动态构建 LINQ 查询,支持字符串形式的表达式解析和动态查询操作。它是 .NET 的一个强大工具,适合处理需要灵活定义查询逻辑的场景,例如动态过滤、排序、投影..
小米近期在 GitHub 上开源了名为“ha_xiaomi_home”的项目,即 Home Assistant 米家集成组件。该组件由小米官方支持,旨在让用户在 Home Assistant 中集成和控制小米 IoT 智能设备。主要特点:官方支持:..
C# 13 引入了新的线程同步类型 System.Threading.Lock,它通过作用域管理的方式简化了锁的使用,使代码更加清晰可靠。本文将全面介绍 System.Threading.Lock 的功能、适用场景,并提供完整的运行示例程序。1. 什么是..