手写Dubbo SPI机制和源码解析
2024-04-09 16:15:19  阅读数 3941

版本

2.7.8

SPI机制

官方文档介绍如下

SPI 全称为 Service Provider Interface,是一种服务发现机制。SPI 的本质是将接口实现类的全限定名配置在文件中,并由服务加载器读取配置文件,加载实现类。这样可以在运行时,动态为接口替换实现类。正因此特性,我们可以很容易的通过 SPI 机制为我们的程序提供拓展功能。

说白了,SPI是一种第三方框架常用的扩展手段:第三方框架定义接口,使用者来写实现类,通过SPI机制框架运行时可以获取到这个实现类,通过反射创建对象,并使用这个对象来继续完成业务

SPI机制

所以通过SPI机制,第三方框架可以将某一段业务逻辑交由使用者自定义实现

比如Dubbo的负载均衡策略,内置提供了多种常用策略(Random/RoundRobin..),但依然无法满足所有用户的需求

通过SPI机制,可以让用户自己实现负载均衡策略,Dubbo再发送RPC调用时通过SPI获取到用户实现的策略,并使用这个策略来决策最终选择调用的服务端

Java SPI

jdk提供了简单的SPI功能,可以再运行时获取某接口的所有扩展实现类,比如,定义一个接口:Car

public interface Car {
    void run();
}

定义两个实现:Audi(奥迪)和Buick(别克)

public class Audi implements Car {
    @Override
    public void run() {
        System.out.println("Audi is running");
    }
}
public class Buick implements Car {
    @Override
    public void run() {
        System.out.println("Buick is running");
    }
}

在 META-INF/services 文件夹下创建一个文件,名称为 Car 的全限定名 com.pq.pure.spi.Car。文件内容为实现类的全限定的类名,如下:

com.pq.pure.spi.Buick
com.pq.pure.spi.Audi

Java SPI Dubbo SPI 的相关逻辑被封装在了ServiceLoader下,测试一下

public class SPITest {
    @Test
    public void run() {
        ServiceLoader<Car> serviceLoader = ServiceLoader.load(Car.class);
        serviceLoader.forEach(Car::run);
    }
}

输出如下

JAVA SPI

成功加载了两个实现类,并实例化且循环执行了run方法

Dubbo SPI

Java提供的SPI可以获取某个接口的所有实现,一般后续代码就是全部循环执行,可以新增,但不能只指定其中某一个执行,比较使用的场景比如~后置处理器

而Dubbo需要的场景一般是从接口的实现中指定某一个(比如从多个负载均衡器中选用一个)去执行,这种场景Java SPI就很难实现了,所以Dubbo自己实现了一套SPI机制:

  • 可以给每个实现取一个名字
  • 可以按名字获取对应的实现

可以理解为JAVA SPI的所有实现是一个LIST,可以循环但不能指定某一个,而Dubbo SPI所有实现是一个MAP,可以根据key获取指定的一个

Dubbo SPI

接下来就测试一下Dubbo SPI的使用,还是刚才的一个接口和两个实现,在
META-INF/dubbo目录下文件夹下以 Car 的全限定名创建文件,内容如下

Buick=com.pq.pure.spi.Buick
Audi=com.pq.pure.spi.Audi

等号前面是key后面是value

Dubbo SPI 的相关逻辑被封装在了ExtensionLoader类中,测试一下(需要给Car接口加上@SPI注解)

public class DubboSPITest {
    public static void main(String[] args) {
        // 初始化Car接口的扩展类加载器
        ExtensionLoader<Car> extensionLoader = ExtensionLoader.getExtensionLoader(Car.class);
        // 获取名为"Buick"的扩展实现
        Car buick = extensionLoader.getExtension("Buick");
        // 运行
        buick.run();
    }
}

运行结果如下

Buick

这就是Dubbo SPI的更强的地方,可以按名称获取某一个实现,这样就可以实现通过配置来切换实现,也方便自定义扩展实现

模拟实现

接下来再深度研究下Dubbo SPI如何做到的

首先如果自己去实现,如何做到?大概整理一下实现流程,其实很简单

  • 约定一个地址,让用户去里面定义文件,以key=value的形式填写实现名称和全限定名
  • 当获取某个接口的某个名称实现时,去约定地址下读取名为接口全限定名文件,扫描文件内容,获取到key为该名称的value(即实现的全限定名),通过类加载器加载这个类,然后通过反射创建实例返回

思路屡清了,很简单,接下来尝试实现一下

做一个接口扩展加载器,用泛型代表接口类型,并约定好扩展文件地址: META-INF/pq下

public class ExtensionLoader<T> {
    /**
     * 接口的类
     */
    private final Class<T> type;

    /**
     * 约定好的地址
     */
    private final static String dir = "META-INF/pq/";

    public ExtensionLoader(Class<T> type) {
        this.type = type;
    }
}

在约定路径 META-INF/pq 下创建扩展文件com.pq.pure.spi.Car,内容与之前一样

com.pq.pure.spi.Car

实现类加载功能,即把扩展文件中的内容转换为MAP内存结构

MAP内存结构

代码如下

/**
 * 获取当前接口的扩展类,即把扩展文件中的的数据转换为map结构
 *
 * @return
 */
private Map<String, Class<?>> loadExtensionClasses() {
    try {
        // 存储结果
        Map<String, Class<?>> extensionClasses = new HashMap<>();
        // 扩展文件名称
        String fileName = dir + type.getName();
        // jdk 类加载器
        ClassLoader classLoader = Thread.currentThread().getContextClassLoader();
        // 加载配置文件
        Enumeration<URL> urls = classLoader.getResources(fileName);

        if (urls != null) {
            while (urls.hasMoreElements()) {
                URL resourceURL = urls.nextElement();
                loadResource(extensionClasses, classLoader, resourceURL);
            }
        }
        return extensionClasses;
    } catch (Throwable t) {
        throw new IllegalStateException();
    }
}

/**
 * 读取扩展文件
 * @param extensionClasses
 * @param classLoader
 * @param resourceURL
 */
private void loadResource(Map<String, Class<?>> extensionClasses, ClassLoader classLoader,
                          URL resourceURL) {
    try {
        try (BufferedReader reader = new BufferedReader(new InputStreamReader(resourceURL.openStream(), StandardCharsets.UTF_8))) {
            String line;
            // 逐行读取
            while ((line = reader.readLine()) != null) {
                line = line.trim();
                if (line.length() > 0) {
                    // 找到等号
                    int i = line.indexOf('=');
                    // name
                    String name = line.substring(0, i).trim();
                    // 实现类全限定名
                    line = line.substring(i + 1).trim();
                    extensionClasses.put(name, Class.forName(line, true, classLoader));
                }
            }
        }
    } catch (Throwable t) {
       throw new IllegalStateException();
    }
}

主要用到了类加载的功能,和文件读取的一些逻辑

最后,根据名字获取某个实现的实例,很简单,从map中读取class,反射实例化即可

/**
 * 根据name获取实现实例
 * @param name
 * @return
 */
public T getExtension(String name) {
    // todo 省去了缓存逻辑
    // 获取改名字的实现类
    Class<?> clazz = loadExtensionClasses().get(name);
    try {
        // 反射实例化
        return (T) clazz.newInstance();
    } catch (Exception e) {
        throw new IllegalStateException();
    }
}

测试一下

package com.pq.pure.spi;

import com.pq.pure.spi.extension.ExtensionLoader;

public class MyDubboTest {
    public static void main(String[] args) {
        ExtensionLoader<Car> extensionLoader = new ExtensionLoader(Car.class);
        // 获取别克的实现
        Car buick = extensionLoader.getExtension("Audi");
        // 运行
        buick.run(); // 输出 Audi is running
    }
}

至此就实现了一个运行时按名称获取对应实现的SPI功能~

源码

回头看dubbo的实现源码,其实上一步的模拟实现就是从源码摘抄的主线代码,但是省略了很多功能、异常校验、线程安全、缓存等,下面来学习下Dubbo源码的优秀写法

缓存

因为读取文件,反射这些代码都是比较耗时的,而且读取一次之后完全可以缓存起来下次直接使用,所以Dubbo的ExtensionLoader源码中包含大量的缓存逻辑,比如

// 缓存每个可扩展接口的扩展加载器,是一个静态全局缓存
static ConcurrentMap<Class<?>, ExtensionLoader<?>> EXTENSION_LOADERS
// 缓存当前扩展加载器每个扩展实现类的实例
ConcurrentMap<Class<?>, Object> EXTENSION_INSTANCES
// 缓存当前扩展加载器每个实现名称对应的实现类
Holder<Map<String, Class<?>>> cachedClasses
// 缓存当前扩展加载器每个实现名称对应的实现类实例
ConcurrentMap<String, Holder<Object>> cachedInstances
配置路径

在我们的模拟实现中使用一个静态变量来约定配置的路径:

private final static String dir = "META-INF/pq/";

而dubbo的实现更具有扩展性,并且是使用Java SPI来实现这种扩展性

首先dubbo定义了一个加载策略的接口

LoadingStrategy

最重要的方法就是directory(),返回的就是配置路径
在ExtensionLoader类中存放静态的加载策略实现数组

public class ExtensionLoader<T> {
    //...
    private static volatile LoadingStrategy[] strategies = loadLoadingStrategies();
    private static LoadingStrategy[] loadLoadingStrategies() {
        // 通过JAVA SPI加载策略实现类
        return stream(ServiceLoader.load(LoadingStrategy.class).spliterator(), false)
                .sorted()
                .toArray(LoadingStrategy[]::new);
    }
    //...
}

可以到Dubbo jar包中META-INF/services下找到其实现配置文件

LoadingStrategy扩展配置文件
内容

内置三个策略,分别对应"META-INF/dubbo/internal/","META-INF/dubbo/","META-INF/services/"三个路径,而且可以继续扩展

AOP

Dubbo SPI还支持面向切面编程,回到Dubbo SPI那个例子,我们的Car接口有两种实现:别克&奥迪,如果有个需求是不管使用什么车,都要加一个行车记录仪,这时只需要加一个行车记录仪的装饰器即可

public class CarRecorderWrapper implements Car {

    private Car car;

    public CarRecorderWrapper(Car car) {
        this.car = car;
    }

    @Override
    public void run() {
        car.run();
        System.out.println("driving recorder");
    }
}

配置文件也加入

CarRecorder=com.pq.pure.spi.CarRecorderWrapper

这时再次运行原测试用例,结果如下

AOP

而其实现方式:再扫描实现时看看你的这个类是不是装饰器类,如果是,就缓存起来

loadClass

而是否是装饰器类就是看是否有以该接口为参数的构造方法

isWrapperClass

熟悉装饰器模式的人应该一看就懂
再实例化时createExtension,会使用所有装饰器对其装饰一遍,以达到代理的目的

createExtension
线程安全

这事挺不足道的,但感觉写的挺巧妙就研究一下

源码中线程安全考虑主要是对以上这些缓存,比如 cachedInstances 保存的是一个名称到实例映射的 ConcurrentMap,但是依然会出问题:

比如两个线程同时要获取相同名称的实例,发现缓存中没有,于是两个线程同时开始进行读取配置创建实例一系列操作,但最终只有先实例化完的线程成功的把实例存入缓存(使用putIfAbsent),而另一个线程就耗费了时间和资源去实例化了一个无用的对象

线程时序图1

一般自己写代码这种情况其实也可以接受,至少不会出现bug,只是有点性能浪费

如果想保证只有一个线程加载实例化,用锁即可,比如用synchronized给cachedInstances上锁就可以解决,但是锁的粒度太大,会导致其它实现的实例化过程都被阻塞

Dubbo解决问题的方法还是挺巧妙的:

如果细心看可以发现cachedInstances存储的并不是 ConcurrentMap<String, Object> 而是 ConcurrentMap<String, Holder<Object>>,使用了一个Holder来存放对象,看一下Holder类

public class Holder<T> {

    private volatile T value;
    public void set(T value) {
        this.value = value;
    }
    public T get() {
        return value;
    }
}

就是一个存放对象的类,使用volatile保证对象的可见性,初看感觉这个类莫名其妙,继续往下看getExtension

getExtension
getOrCreateHolder

以上代码逻辑:当获取某名称实例时,会走getOrCreateHolder方法在缓存中该名称位置存放一个空Holder对象,且只有第一个线程创建,其它线程只是获取,该方法返回holder对象,通过synchronized给holder上锁,然后检查是否为空,如果为空就创建,这样就保证只有一个线程会实际执行实例化的代码,而且synchronized的锁粒度只是当前名称的实现,不妨碍其它实现的实例化

线程时序图2

所以可以说Holder的存在就是为了控制synchronized的锁粒度

其它

DUBBO SPI还支持IOC,并且涉及到一个扩展点自适应机制,相对复杂一点,留下一篇研究~