Cluster computing

A set of previous articles elaborated on swapping deep learning models for detecting objects from scenes in aerial drone images. Regardless of the choices, the implementation is nearly the same. For example,

import numpy as np
from tensorflow.keras.preprocessing import image
from tensorflow.keras.applications.densenet import DenseNet121, preprocess_input, decode_predictions
import matplotlib.pyplot as plt

# Load pretrained DenseNet121 model
model = DenseNet121(weights='imagenet')

# Load and preprocess your aerial drone image
def load_and_prepare_image(img_path):
    img = image.load_img(img_path, target_size=(224, 224)) # Resize to model input size
    img_array = image.img_to_array(img)
    img_array = np.expand_dims(img_array, axis=0)
    img_array = preprocess_input(img_array)
    return img_array

# Run inference and decode predictions
def classify_image(img_path):
    img_array = load_and_prepare_image(img_path)
    preds = model.predict(img_array)
    decoded = decode_predictions(preds, top=5)[0] # Top 5 predictions
    print(f"\nPredictions for {img_path}:")
    for i, (imagenet_id, label, prob) in enumerate(decoded):
        print(f"{i+1}. {label}: {prob:.4f}")

# Example usage
image_path = "your_aerial_image.jpg"

classify_image(image_path)

And with sample execution as:
Downloading data from https://storage.googleapis.com/tensorflow/keras-applications/densenet/densenet121_weights_tf_dim_ordering_tf_kernels.h5 33188688/33188688 ━━━━━━━━━━━━━━━━━━━━ 3s 0us/step
1/1 ━━━━━━━━━━━━━━━━━━━━ 4s 4s/step
Downloading data from https://storage.googleapis.com/download.tensorflow.org/data/imagenet_class_index.json
35363/35363 ━━━━━━━━━━━━━━━━━━━━ 0s 1us/step

Predictions for parking2.jpg:

crane: 0.2962

toyshop: 0.1025

altar: 0.0526

guillotine: 0.0418

bell_cote: 0.0228

Some of the categories of objects detected in urban areas include:
category_names = ['false_detection', 'airport', 'airport_hangar', 'airport_terminal', 'amusement_park', 'aquaculture', 'archaeological_site', 'barn', 'border_checkpoint', 'burial_site', 'car_dealership', 'construction_site', 'crop_field', 'dam', 'debris_or_rubble', 'educational_institution', 'electric_substation', 'factory_or_powerplant', 'fire_station', 'flooded_road', 'fountain', 'gas_station', 'golf_course', 'ground_transportation_station', 'helipad', 'hospital', 'interchange', 'lake_or_pond', 'lighthouse', 'military_facility', 'multi-unit_residential', 'nuclear_powerplant', 'office_building', 'oil_or_gas_facility', 'park', 'parking_lot_or_garage', 'place_of_worship', 'police_station', 'port', 'prison', 'race_track', 'railway_bridge', 'recreational_facility', 'impoverished_settlement', 'road_bridge', 'runway', 'shipyard', 'shopping_mall', 'single-unit_residential', 'smokestack', 'solar_farm', 'space_facility', 'stadium', 'storage_tank','surface_mine', 'swimming_pool', 'toll_booth', 'tower', 'tunnel_opening', 'waste_disposal', 'water_treatment_facility', 'wind_farm', 'zoo']

If a custom model needs to be built, it could be implemented with something like:

import json
from keras.optimizers import Adam
from keras.callbacks import ModelCheckpoint
from keras.preprocessing import image
from keras.models import Model, load_model
from keras.applications import imagenet_utils
from data_ml_functions.mlFunctions import get_cnn_model,img_metadata_generator,get_lstm_model,codes_metadata_generator
from data_ml_functions.dataFunctions import prepare_data,calculate_class_weights
import numpy as np
import os

import tensorflow as tf
from data_ml_functions.SpatialPyramidPooling import SpatialPyramidPooling

from data_ml_functions.multi_gpu import make_parallel

from concurrent.futures import ProcessPoolExecutor
from tqdm import tqdm

import time

import pdb

class FMOWBaseline:
    def __init__(self, params=None, argv=None):
        """
        Initialize baseline class, prepare data, and calculate class weights.
        :param params: global parameters, used to find location of the dataset and json file
        :return:
        """
        self.params = params

        for arg in argv:
            if arg == '-prepare':
                prepare_data(params)
                calculate_class_weights(params)
            performAll = (arg == '-all')
            if performAll or arg == '-cnn':
                self.params.train_cnn = True
            if performAll or arg == '-codes':
                self.params.generate_cnn_codes = True
            if performAll or arg == '-lstm':
                self.params.train_lstm = True
            if performAll or arg == '-test':
                self.params.test_cnn = True
                self.params.test_lstm = True
            if performAll or arg == '-test_cnn':
                self.params.test_cnn = True
            if performAll or arg == '-test_lstm':
                self.params.test_lstm = True

            if arg == '-nm':
                self.params.use_metadata = False

        if self.params.use_metadata:
            # self.params.files['cnn_model'] = os.path.join(self.params.directories['cnn_models'], 'cnn_model_with_metadata.model')
            self.params.files['cnn_model'] = os.path.join(self.params.directories['cnn_models'], 'cnn_image_and_metadata.model')
            # self.params.files['lstm_model'] = os.path.join(self.params.directories['lstm_models'], 'lstm_model_with_metadata.model')
            self.params.files['lstm_model'] = os.path.join(self.params.directories['lstm_models'], 'lstm_image_and_metadata.model')
            self.params.files['cnn_codes_stats'] = os.path.join(self.params.directories['working'], 'cnn_codes_stats_with_metadata.json')
            self.params.files['lstm_training_struct'] = os.path.join(self.params.directories['working'], 'lstm_training_struct_with_metadata.json')
            self.params.files['lstm_test_struct'] = os.path.join(self.params.directories['working'], 'lstm_test_struct_with_metadata.json')

            self.params.files['cnn_finetune_reweight_model'] = os.path.join(self.params.directories['cnn_finetune_reweight_models'], 'cnn_image_and_metadata.model')
            self.params.files['cnn_finetune_reweight_aug_model'] = os.path.join(self.params.directories['cnn_finetune_reweight_aug_models'], 'cnn_image_and_metadata.model')
            self.params.files['cnn_finetune_reweight_nlm_model'] = os.path.join(self.params.directories['cnn_finetune_reweight_nlm_models'], 'cnn_image_and_metadata.model')
            self.params.files['cnn_finetune_reweight_spp_model'] = os.path.join(self.params.directories['cnn_finetune_reweight_spp_models'], 'cnn_image_and_metadata.model')
            self.params.files['cnn_finetune_reweight_deform_model'] = os.path.join(self.params.directories['cnn_finetune_reweight_deform_models'], 'cnn_image_and_metadata.model')

            self.params.files['lstm_finetune_model'] = os.path.join(self.params.directories['lstm_finetune_models'], 'lstm_image_and_metadata.model')
            self.params.files['fusion_reweight_model'] = os.path.join(self.params.directories['fusion_reweight_models'], 'lstm_image_and_metadata.model')

        else:
            self.params.files['cnn_model'] = os.path.join(self.params.directories['cnn_models'], 'cnn_model_no_metadata.model')
            self.params.files['lstm_model'] = os.path.join(self.params.directories['lstm_models'], 'lstm_model_no_metadata.model')
            self.params.files['cnn_codes_stats'] = os.path.join(self.params.directories['working'], 'cnn_codes_stats_no_metadata.json')
            self.params.files['lstm_training_struct'] = os.path.join(self.params.directories['working'], 'lstm_training_struct_no_metadata.json')
            self.params.files['lstm_test_struct'] = os.path.join(self.params.directories['working'], 'lstm_test_struct_no_metadata.json')

    def train_cnn(self):
        """
        Train CNN with or without metadata depending on setting of 'use_metadata' in params.py.
        :param:
        :return:
        """

        trainData = json.load(open(self.params.files['training_struct']))
        metadataStats = json.load(open(self.params.files['dataset_stats']))

        model = get_cnn_model(self.params)

        if self.params.use_finetune:
            model.load_weights(self.params.files['cnn_model'], by_name=True)

        model = make_parallel(model, self.params.num_gpus_parallel)
        model.compile(optimizer=Adam(lr=self.params.cnn_adam_learning_rate), loss='categorical_crossentropy', metrics=['accuracy'])

        train_datagen = img_metadata_generator(self.params, trainData, metadataStats)

        print("training")
        if self.params.use_finetune and self.params.use_reweight and self.params.use_aug:
            filePath = os.path.join(self.params.directories['cnn_finetune_reweight_aug_checkpoint_weights'], 'weights.{epoch:02d}.hdf5')
        elif self.params.use_finetune and self.params.use_reweight and ~self.params.use_aug:
            filePath = os.path.join(self.params.directories['cnn_finetune_reweight_checkpoint_weights'], 'weights.{epoch:02d}.hdf5')
        else:
            filePath = os.path.join(self.params.directories['cnn_checkpoint_weights'], 'weights.{epoch:02d}.hdf5')

        checkpoint = ModelCheckpoint(filepath=filePath, monitor='loss', verbose=0, save_best_only=False,
                                     save_weights_only=False, mode='auto', period=5)
        callbacks_list = [checkpoint]

        if self.params.use_reweight:
            model.fit_generator(train_datagen,
                                steps_per_epoch=(len(trainData) / self.params.batch_size_cnn + 1),
                                epochs=self.params.cnn_epochs, callbacks=callbacks_list,
                                class_weight=self.params.category_weighting)
        else:
            model.fit_generator(train_datagen,
                                steps_per_epoch=(len(trainData) / self.params.batch_size_cnn + 1),
                                epochs=self.params.cnn_epochs, callbacks=callbacks_list)

        if self.params.use_finetune and self.params.use_reweight and self.params.use_nlm:
            model.save(self.params.files['cnn_finetune_reweight_nlm_model'])
        elif self.params.use_finetune and self.params.use_reweight and self.params.use_spp:
            model.save(self.params.files['cnn_finetune_reweight_spp_model'])
        elif self.params.use_finetune and self.params.use_reweight and self.params.use_deform:
            model.save(self.params.files['cnn_finetune_reweight_deform_model'])
        elif self.params.use_finetune and self.params.use_reweight and self.params.use_aug:
            model.save(self.params.files['cnn_finetune_reweight_aug_model'])
        elif self.params.use_finetune and self.params.use_reweight and ~self.params.use_nlm and ~self.params.use_spp and ~self.params.use_deform and ~self.params.use_aug:
            model.save(self.params.files['cnn_finetune_reweight_model'])
        else:
            model.save(self.params.files['cnn_model'])

    def train_lstm(self):
        """
        Train LSTM pipeline using pre-generated CNN codes.
        :param:
        :return:
        """

        codesTrainData = json.load(open(self.params.files['lstm_training_struct']))
        codesStats = json.load(open(self.params.files['cnn_codes_stats']))
        metadataStats = json.load(open(self.params.files['dataset_stats']))

        model = get_lstm_model(self.params, codesStats)

        if self.params.use_finetune and ~self.params.use_fusion:
            model.load_weights(self.params.files['lstm_model'])

        model = make_parallel(model, self.params.num_gpus_parallel)
        model.compile(optimizer=Adam(lr=self.params.lstm_adam_learning_rate), loss='categorical_crossentropy', metrics=['accuracy'])

        train_datagen = codes_metadata_generator(self.params, codesTrainData, metadataStats, codesStats)

        print("training")
        if self.params.use_fusion and self.params.use_reweight:
            filePath = os.path.join(self.params.directories['fusion_reweight_checkpoint_weights'], 'weights.{epoch:02d}.hdf5')
        elif ~self.params.use_fusion and self.params.use_finetune:
            filePath = os.path.join(self.params.directories['lstm_finetune_checkpoint_weights'], 'weights.{epoch:02d}.hdf5')
        else:
            filePath = os.path.join(self.params.directories['lstm_checkpoint_weights'], 'weights.{epoch:02d}.hdf5')

        checkpoint = ModelCheckpoint(filepath=filePath, monitor='loss', verbose=0, save_best_only=False, save_weights_only=False, mode='auto', period=10)
        callbacks_list = [checkpoint]

        if self.params.use_reweight:
            model.fit_generator(train_datagen,
                                steps_per_epoch=(len(codesTrainData) / self.params.batch_size_lstm + 1),
                                epochs=self.params.lstm_epochs, callbacks=callbacks_list,
                                max_queue_size=20,
                                class_weight=self.params.category_weighting)
        else:
            model.fit_generator(train_datagen,
                                steps_per_epoch=(len(codesTrainData) / self.params.batch_size_lstm + 1),
                                epochs=self.params.lstm_epochs, callbacks=callbacks_list,
                                max_queue_size=20)

        if self.params.use_fusion and self.params.use_reweight:
            model.save(self.params.files['fusion_reweight_model'])
        elif ~self.params.use_fusion and self.params.use_finetune:
            model.save(self.params.files['lstm_finetune_model'])
        else:
            model.save(self.params.files['lstm_model'])

    def generate_cnn_codes(self):
        """
        Use trained CNN to generate CNN codes/features for each image or (image, metadata) pair
        which can be used to train an LSTM.
        :param:
        :return:
        """

        metadataStats = json.load(open(self.params.files['dataset_stats']))
        trainData = json.load(open(self.params.files['training_struct']))
        testData = json.load(open(self.params.files['test_struct']))

        # cnnModel = load_model(self.params.files['cnn_model'])
        # cnnModel = get_cnn_model(self.params)

        if self.params.use_finetune and self.params.use_reweight and self.params.use_nlm:
            cnnModel = load_model(self.params.files['cnn_finetune_reweight_nlm_model'], custom_objects={'tf':tf})
            cnnModel = cnnModel.layers[-2]
        elif self.params.use_finetune and self.params.use_reweight and self.params.use_spp:
            cnnModel = load_model(self.params.files['cnn_finetune_reweight_spp_model'], custom_objects={'tf':tf, 'SpatialPyramidPooling':SpatialPyramidPooling})
            cnnModel = cnnModel.layers[-2]
        elif self.params.use_finetune and self.params.use_reweight and self.params.use_deform:
            cnnModel = load_model(self.params.files['cnn_finetune_reweight_deform_model'], custom_objects={'tf':tf})
            cnnModel = cnnModel.layers[-2]
        elif self.params.use_finetune and self.params.use_reweight and self.params.use_aug:
            cnnModel = load_model(self.params.files['cnn_finetune_reweight_aug_model'], custom_objects={'tf':tf})
            cnnModel = cnnModel.layers[-2]
        elif self.params.use_finetune and self.params.use_reweight and ~self.params.use_nlm and ~self.params.use_spp and ~self.params.use_deform and ~self.params.use_aug:
            cnnModel = load_model(self.params.files['cnn_finetune_reweight_model'], custom_objects={'tf':tf})
            cnnModel = cnnModel.layers[-2]
        else:
            cnnModel = load_model(self.params.files['cnn_model'])

        featuresModel = Model(cnnModel.inputs, cnnModel.layers[-6].output)

        allTrainCodes = []

        featureDirs = ['train', 'test']

        for featureDir in featureDirs:

            codesData = {}

            isTrain = (featureDir == 'train')
            index = 0

            if isTrain:
                data = trainData
            else:
                data = testData

            outDir = os.path.join(self.params.directories['cnn_codes'], featureDir)
            if not os.path.isdir(outDir):
                os.mkdir(outDir)

            N = len(data)
            initBatch = True
            for i,currData in enumerate(tqdm(data)):
                if initBatch:
                    if N-i < self.params.batch_size_eval:
                        batchSize = 1
                    else:
                        batchSize = self.params.batch_size_eval
                    imgdata = np.zeros((batchSize, self.params.target_img_size[0], self.params.target_img_size[1], self.params.num_channels))
                    metadataFeatures = np.zeros((batchSize, self.params.metadata_length))
                    batchIndex = 0
                    tmpBasePaths = []
                    tmpFeaturePaths = []
                    tmpCategories = []
                    initBatch = False

                path,_ = os.path.split(currData['img_path'])
                if isTrain:
                    basePath = path[len(self.params.directories['train_data'])+1:]
                else:
                    basePath = path[len(self.params.directories['test_data'])+1:]

                tmpBasePaths.append(basePath)
                if isTrain:
                    tmpCategories.append(currData['category'])

                origFeatures = np.array(json.load(open(currData['features_path'])))
                tmpFeaturePaths.append(currData['features_path'])

                metadataFeatures[batchIndex, :] = np.divide(origFeatures - np.array(metadataStats['metadata_mean']), metadataStats['metadata_max'])
                imgdata[batchIndex,:,:,:] = image.img_to_array(image.load_img(currData['img_path']))

                batchIndex += 1

                if batchIndex == batchSize:
                    imgdata = imagenet_utils.preprocess_input(imgdata)
                    imgdata = imgdata / 255.0

                    if self.params.use_metadata:
                        cnnCodes = featuresModel.predict([imgdata,metadataFeatures], batch_size=batchSize)
                    else:
                        cnnCodes = featuresModel.predict(imgdata, batch_size=batchSize)

                    for codeIndex,currCodes in enumerate(cnnCodes):
                        currBasePath = tmpBasePaths[codeIndex]
                        outFile = os.path.join(outDir, '%07d.json' % index)
                        index += 1
                        json.dump(currCodes.tolist(), open(outFile, 'w'))
                        if currBasePath not in codesData.keys():
                            codesData[currBasePath] = {}
                            codesData[currBasePath]['cnn_codes_paths'] = []
                            if self.params.use_metadata:
                                codesData[currBasePath]['metadata_paths'] = []
                            if isTrain:
                                codesData[currBasePath]['category'] = tmpCategories[codeIndex]
                        codesData[currBasePath]['cnn_codes_paths'].append(outFile)
                        if self.params.use_metadata:
                            codesData[currBasePath]['metadata_paths'].append(tmpFeaturePaths[codeIndex])
                        if isTrain:
                            allTrainCodes.append(currCodes)
                        initBatch = True

            if isTrain:
                codesTrainData = codesData
            else:
                codesTestData = codesData

        N = len(allTrainCodes[0])
        sumCodes = np.zeros(N)
        for currCodes in allTrainCodes:
            sumCodes += currCodes
        avgCodes = sumCodes / len(allTrainCodes)
        maxCodes = np.zeros(N)
        for currCodes in allTrainCodes:
            maxCodes = np.maximum(maxCodes, np.abs(currCodes-avgCodes))
        maxCodes[maxCodes == 0] = 1

        maxTemporal = 0
        for key in codesTrainData.keys():
            currTemporal = len(codesTrainData[key]['cnn_codes_paths'])
            if currTemporal > maxTemporal:
                maxTemporal = currTemporal

        codesStats = {}
        codesStats['codes_mean'] = avgCodes.tolist()
        codesStats['codes_max'] = maxCodes.tolist()
        codesStats['max_temporal'] = maxTemporal

        json.dump(codesTrainData, open(self.params.files['lstm_training_struct'], 'w'))
        json.dump(codesStats, open(self.params.files['cnn_codes_stats'], 'w'))
        json.dump(codesTestData, open(self.params.files['lstm_test_struct'], 'w'))

    def test_models(self):

        codesTestData = json.load(open(self.params.files['lstm_test_struct']))
        metadataStats = json.load(open(self.params.files['dataset_stats']))

        metadataMean = np.array(metadataStats['metadata_mean'])
        metadataMax = np.array(metadataStats['metadata_max'])

        # cnnModel = load_model(self.params.files['cnn_model'])
        # cnnModel = get_cnn_model(self.params)

        if self.params.use_finetune and self.params.use_reweight and self.params.use_nlm:
            cnnModel = load_model(self.params.files['cnn_finetune_reweight_nlm_model'], custom_objects={'tf':tf})
            cnnModel = cnnModel.layers[-2]
        elif self.params.use_finetune and self.params.use_reweight and self.params.use_spp:
            cnnModel = load_model(self.params.files['cnn_finetune_reweight_spp_model'], custom_objects={'tf':tf, 'SpatialPyramidPooling':SpatialPyramidPooling})
            cnnModel = cnnModel.layers[-2]
        elif self.params.use_finetune and self.params.use_reweight and self.params.use_deform:
            cnnModel = load_model(self.params.files['cnn_finetune_reweight_deform_model'], custom_objects={'tf':tf})
            cnnModel = cnnModel.layers[-2]
        elif self.params.use_finetune and self.params.use_reweight and self.params.use_aug:
            cnnModel = load_model(self.params.files['cnn_finetune_reweight_aug_model'], custom_objects={'tf':tf})
            cnnModel = cnnModel.layers[-2]
        elif self.params.use_finetune and self.params.use_reweight and ~self.params.use_nlm and ~self.params.use_spp and ~self.params.use_deform:
            cnnModel = load_model(self.params.files['cnn_finetune_reweight_model'], custom_objects={'tf':tf})
            cnnModel = cnnModel.layers[-2]
        else:
            cnnModel = load_model(self.params.files['cnn_model'])

        if self.params.test_lstm:
            codesStats = json.load(open(self.params.files['cnn_codes_stats']))
            # lstmModel = load_model(self.params.files['lstm_model'])
            # lstmModel = get_lstm_model(self.params, codesStats)
            if self.params.use_fusion and self.params.use_reweight:
                lstmModel = load_model(self.params.files['fusion_reweight_model'], custom_objects={'tf':tf})
                lstmModel = lstmModel.layers[-2]
            elif ~self.params.use_fusion and self.params.use_finetune:
                lstmModel = load_model(self.params.files['lstm_finetune_model'], custom_objects={'tf':tf})
                lstmModel = lstmModel.layers[-2]
            else:
                lstmModel = load_model(self.params.files['lstm_model'], custom_objects={'tf':tf})
                lstmModel = lstmModel.layers[-2]

        index = 0
        timestr = time.strftime("%Y%m%d-%H%M%S")

        if self.params.test_cnn:
            fidCNN = open(os.path.join(self.params.directories['predictions'], 'predictions-cnn-%s.txt' % timestr), 'w')
        if self.params.test_lstm:
            fidLSTM = open(os.path.join(self.params.directories['predictions'], 'predictions-lstm-%s.txt' % timestr), 'w')

        def walkdir(folder):
            for root, dirs, files in os.walk(folder):
                if len(files) > 0:
                    yield (root, dirs, files)

        num_sequences = 0
        for _ in walkdir(self.params.directories['test_data']):
            num_sequences += 1

        for root, dirs, files in tqdm(walkdir(self.params.directories['test_data']), total=num_sequences):
            if len(files) > 0:
                imgPaths = []
                metadataPaths = []
                slashes = [i for i,ltr in enumerate(root) if ltr == '/']
                bbID = int(root[slashes[-1]+1:])

            for file in files:
                if file.endswith('.jpg'):
                    imgPaths.append(os.path.join(root,file))
                    metadataPaths.append(os.path.join(root, file[:-4]+'_features.json'))

            if len(files) > 0:
                inds = []
                for metadataPath in metadataPaths:
                    underscores = [ind for ind,ltr in enumerate(metadataPath) if ltr == '_']
                    inds.append(int(metadataPath[underscores[-3]+1:underscores[-2]]))
                inds = np.argsort(np.array(inds)).tolist()

                currBatchSize = len(inds)
                imgdata = np.zeros((currBatchSize, self.params.target_img_size[0], self.params.target_img_size[1], self.params.num_channels))
                metadataFeatures = np.zeros((currBatchSize, self.params.metadata_length))

                codesIndex = 0
                codesPaths = codesTestData[root[24:]]
                codesFeatures = []
                for ind in inds:
                    img = image.load_img(imgPaths[ind])
                    img = image.img_to_array(img)
                    img.setflags(write=True)
                    imgdata[ind,:,:,:] = img

                    features = np.array(json.load(open(metadataPaths[ind])))
                    features = np.divide(features - metadataMean, metadataMax)
                    metadataFeatures[ind,:] = features

                    codesFeatures.append(json.load(open(codesPaths['cnn_codes_paths'][codesIndex])))
                    codesIndex += 1

                imgdata = imagenet_utils.preprocess_input(imgdata)
                imgdata = imgdata / 255.0

                if self.params.test_cnn:
                    if self.params.use_metadata:
                        predictionsCNN = np.sum(cnnModel.predict([imgdata, metadataFeatures], batch_size=currBatchSize), axis=0)
                    else:
                        predictionsCNN = np.sum(cnnModel.predict(imgdata, batch_size=currBatchSize), axis=0)

                if self.params.test_lstm:
                    if self.params.use_metadata:
                        # codesMetadata = np.zeros((1, codesStats['max_temporal'], self.params.cnn_seq2seq_layer_length+self.params.metadata_length))
                        codesMetadata = np.zeros((1, codesStats['max_temporal'], self.params.cnn_lstm_layer_length+self.params.metadata_length))
                    else:
                        # codesMetadata = np.zeros((1, codesStats['max_temporal'], self.params.cnn_seq2seq_layer_length))
                        codesMetadata = np.zeros((1, codesStats['max_temporal'], self.params.cnn_lstm_layer_length))

                    timestamps = []
                    for codesIndex in range(currBatchSize):
                        cnnCodes = codesFeatures[codesIndex]
                        timestamp = (cnnCodes[4]-1970)*525600 + cnnCodes[5]*12*43800 + cnnCodes[6]*31*1440 + cnnCodes[7]*60
                        timestamps.append(timestamp)
                        cnnCodes = np.divide(cnnCodes - np.array(codesStats['codes_mean']), np.array(codesStats['codes_max']))
                        codesMetadata[0,codesIndex,:] = cnnCodes

                    sortedInds = sorted(range(len(timestamps)), key=lambda k:timestamps[k])
                    codesMetadata[0,range(len(sortedInds)),:] = codesMetadata[0,sortedInds,:]

                    predictionsLSTM = lstmModel.predict(codesMetadata, batch_size=1)

            if len(files) > 0:
                if self.params.test_cnn:
                    predCNN = np.argmax(predictionsCNN)
                    oursCNNStr = self.params.category_names[predCNN]
                    fidCNN.write('%d,%s\n' % (bbID,oursCNNStr))
                if self.params.test_lstm:
                    predLSTM = np.argmax(predictionsLSTM)
                    oursLSTMStr = self.params.category_names[predLSTM]
                    fidLSTM.write('%d,%s\n' % (bbID,oursLSTMStr))
                index += 1

        if self.params.test_cnn:
            fidCNN.close()
        if self.params.test_lstm:
            fidLSTM.close()


There are training datasets online but building a custom model allows us to finetune the weights from our object annotations from our own dataset of images.

#codingExercise: CodingCodingExercise-10-25-2025.docx

Cluster computing

Saturday, October 25, 2025

No comments:

Post a Comment